
Contenido
- Rediseño de las colas de prueba: adaptando la priorización y las pruebas secuenciales y repetidas
- Especificaciones del proyecto y sistemas de flujo de trabajo de laboratorio anteriores
- Proceso de diseño de software
- Herramientas de programación y arquitectura de red
- Rediseño del procesamiento de muestras: permitir la redirección de muestras en función de problemas comunes
Los materiales biológicos iniciales recibidos en el laboratorio, incluida la sangre, el aspirado de médula ósea, otros fluidos corporales o bloques / portaobjetos de tejidos incluidos en parafina, se denominan aquí muestras. Los lisados de ADN, ARN o proteínas procesados se denominan materiales procesados y, a veces, se obtienen después de una purificación, microdisección o separación celular adicional de las muestras.
Estas representaciones aproximadas retienen suficiente información sobre la secuencia original para recapitular los principales hallazgos de muchos flujos de trabajo exactos pero computacionalmente intensivos. La mayoría de los algoritmos de dibujo estiman la similitud de secuencia de alguna manera, lo que le permite obtener información a partir de estas comparaciones. Por ejemplo, se pueden utilizar algoritmos de esbozo para estimar la similitud de muestra total que se puede visualizar como un análisis de componentes principales oracionesalavirgenmaria.com o una gráfica de escala multidimensional, o se puede utilizar para construir un árbol filogenético con topología precisa. Los algoritmos de creación de bocetos también reducen drásticamente el tiempo de ejecución de las comparaciones con bases de datos (por ejemplo, todo GenBank), lo que permite a los usuarios comparar rápidamente sus datos con grandes bases de datos públicas. El diseño experimental, la búsqueda o generación de datos y el control de calidad son partes esenciales de la biología intensiva en datos.
Rediseño de las colas de prueba: adaptando la priorización y las pruebas secuenciales y repetidas
Obtenga información rápida utilizando algoritmos de esbozo: Comprender la estructura básica de los datos, la relación entre las muestras y la composición aproximada de cada muestra puede ser muy útil al comienzo del análisis de datos y, a menudo, puede impulsar las decisiones de análisis en direcciones diferentes a las previstas originalmente. Aunque la mayoría de los flujos de trabajo de bioinformática generan software almacen este tipo de conocimientos, existen algunas herramientas que lo hacen rápidamente, lo que permite al usuario generar hipótesis rápidas que pueden probarse con más detalle mediante análisis más detallados y extensos. Los algoritmos de creación de bocetos funcionan con representaciones aproximadas comprimidas de datos de secuencia y, por lo tanto, reducen los tiempos de ejecución y los recursos computacionales.
Estos se utilizan luego como sustrato para las pruebas, a menudo después de la amplificación por PCR, con análisis de fragmentos por electroforesis capilar, secuenciación de ADN, microarrays u otras metodologías moleculares. Este proyecto se llevó a cabo durante los años 2006 a 2008 en el Laboratorio de Diagnóstico Molecular del Centro Oncológico M.D. Anderson de la Universidad de Texas, que realiza pruebas moleculares basadas en ARN costumbres.net y ADN para el cáncer y aplicaciones inmunológicas. El laboratorio informa los resultados en dos sistemas de información de laboratorio diferentes, a saber, Cerner Classic o Powerpath, para muestras de sangre y médula ósea y tejidos y fluidos corporales, respectivamente. Las aplicaciones descritas fueron diseñadas para proporcionar gestión y flujo de trabajo internos del laboratorio y para interactuar con los sistemas de informes LIS.
Especificaciones del proyecto y sistemas de flujo de trabajo de laboratorio anteriores
No hay sustituto para tomarse el tiempo para diseñar adecuadamente su análisis, identificar los datos apropiados y realizar verificaciones de cordura en sus archivos. La documentación generalizada proporciona un contexto indispensable para los conocimientos biológicos derivados de un análisis, facilita la transparencia en la investigación y aumenta la reutilización del código de análisis. La buena documentación cubre todos los aspectos de un proyecto, incluida la organización de archivos y resultados, el código claro y comentado y los documentos explicativos adjuntos para las decisiones de diseño y los metadatos. Los sistemas de flujo de trabajo facilitan la construcción de esta documentación, ya que cada paso del análisis y los vínculos entre esos pasos están completamente especificados dentro de la sintaxis del flujo de trabajo. Esta función agiliza la documentación del código, especialmente si incluye la mayor cantidad de análisis posible dentro del marco de flujo de trabajo automatizado. Fuera del análisis en sí, la aplicación de un diseño organizativo coherente puede aprovechar la estructura y la automatización que proporcionan los flujos de trabajo para simplificar la generación de documentación de calidad para todos los aspectos de su proyecto. A continuación, discutimos las estrategias de gestión de proyectos para la creación de análisis biológicos reproducibles habilitados para el flujo de trabajo.