En un paper publicado en la revista Forensic Science International: Genetics, científicos argentinos presentan un novedoso enfoque, basado en la teoría de la información, que utiliza algoritmos avanzados para establecer relaciones de parentesco de manera rápida y a gran escala.

(Agencia CyTA-Leloir).- Luego del resonante caso de intento de violación seguido de muerte de la adolescente Ángeles Rawson, en 2013 se creó en la Argentina el Registro Nacional de Datos Genéticos (RNDG). Allí comenzó a almacenarse información de condenados por delitos sexuales para que pueda ser contrastada con las evidencias (muestras de ADN) que se recolectan en escenas de crímenes contra la integridad sexual. Casi en paralelo, un equipo interdisciplinario de científicos argentinos desarrolló GENis, un software local que permite almacenar, compartir y comparar perfiles genéticos, que ya está instalado en 20 provincias argentinas y el año pasado comenzó a usar el Cuerpo Médico Forense, que depende de la Corte Suprema de la Nación. También lo utiliza la Fiscalía General de Justicia de la Ciudad de México.

En estos 10 años de existencia, GENis fue evolucionando y cada mejora significativa se compartió con la comunidad científica global en formato de paper. Ahora, el último avance se publicó en la revista Forensic Science International: Genetics. Allí, el trabajo de científicos argentinos propone un enfoque novedoso basado en la teoría de la información para hacer más eficientes los algoritmos y mejorar los resultados de los modelos computacionales a la hora de identificar personas desaparecidas.

Por lo general, en estos casos se suele requerir una prueba de parentesco genético para determinar la relación entre un individuo no identificado y los familiares de la persona que se está buscando. Cuando no se ha recopilado suficiente evidencia genética, la falta de poder estadístico de esas pruebas puede dar lugar a resultados poco fiables, algo especialmente cierto cuando sólo se dispone de unos pocos parientes lejanos para realizar el genotipo.

“Lo que hicimos fue sumar teoría de la información para cuantificar y evaluar la evidencia genética forense que disponemos. Eso nos permite caracterizar el árbol genealógico (pedigrí) genético de la persona perdida, y saber con anticipación cuánta información nos pueden proporcionar los familiares con los que contamos antes de lanzar una búsqueda: si nos damos cuenta de que faltan datos para obtener un resultado determinante se puede aumentar el esfuerzo para encontrar nuevos contribuyentes”, explicó a la Agencia CyTA-Leloir el físico Ariel Chernomoretz, profesor de la Facultad de Ciencias Exactas y Naturales de la UBA, investigador del CONICET y jefe del Laboratorio de Biología de Sistemas Integrativa de la Fundación Instituto Leloir (FIL).

Como la realización de estos estudios es muy costosa, de esta manera se puede priorizar a quiénes analizar y a quiénes no, añadió.

La teoría de la información (TI) es un área amplia de conocimiento propuesta a mediados del siglo XX, que establece principios fundamentales de los sistemas de comunicación y se aplican también en física y biología; es una rama de la teoría de probabilidades matemáticas.  En el artículo, los autores explican que eligieron ese marco teórico porque es “una herramienta poderosa y elegante para cuantificar conceptos como incertidumbre e información” y detallaron que utilizaron ese abordaje para comparar distribuciones de probabilidad de filiación antes y después de incorporar la evidencia genética.

“Estas mejoras metodológicas dan como resultado un proceso de cálculo más rápido y optimizado, que nos permite manejar grandes volúmenes de datos y realizar análisis de manera más eficiente”, aseguran. Los científicos añadieron, además, que la metodología fue diseñada específicamente para ser implementada en GENis, el primer software realizado en Latinoamérica para contrastar perfiles de ADN provenientes de muestras biológicas con el fin de identificar criminales o personas desaparecidas y/o víctimas de desastres. Además, la tecnología desarrollada también puede incorporarse fácilmente a sistemas que utilizan otros algoritmos para realizar análisis forenses.

Ariel Chernomoretz, investigador del CONICET en el Instituto Leloir, lideró el estudio.

Desarrollado por la Fundación Sadosky, junto a la Sociedad Argentina de Genética Forense, el CONICET, la Fundación Instituto Leloir y la Asociación Argentina de Bioinformática y Biología Computacional, entre otras instituciones, GENis es gratuito, de código abierto y permite hacer comparaciones de los perfiles genéticos forenses almacenados en las bases de datos de distintas jurisdicciones.

“En la Argentina cada provincia tiene su propio sistema jurídico, sus leyes, y entonces para implementar un registro nacional hay que compatibilizar muchos aspectos diferentes, lo que lo vuelve muy complejo. Pero una herramienta como GENis, que normatiza las cosas, que establece parámetros de subida y procesamiento de la información, sirve como columna vertebral para eso”, describió Chernomoretz.

GENis es un bien público digital, accesible a toda la comunidad iberoamericana de genetistas forenses para usarla y mejorarla en conjunto. Se encuentra disponible en el repositorio GitHub, está traducido al inglés y hasta se han recibido consultas de países de Asia y África. Como apoyo a su implementación en organismos judiciales, la Fundación Sadosky suministra una capacitación técnica y un acompañamiento a los usuarios para establecer los parámetros iniciales.

Rastreando huellas genéticas

Dentro del ADN de un individuo existen pequeños fragmentos de ADN no codificante (también conocido como ADN “basura”) que se repiten muchas veces. El número de esas repeticiones, a las que se llama microsatélites, varía de persona a persona y se utiliza como una huella dactilar, pero genética. Entre otras cosas, permite establecer identidades y realizar análisis de parentesco.

“La base de GENis es que utiliza la información de estos microsatélites para establecer una identidad genética y compararla con la información que tenemos almacenada. Así podemos establecer cuál es el perfil más probable de una persona desaparecida buscada y sus posibles vínculos con otras”, resaltó Chernomoretz.

Más allá del RNDG, que contiene la información de los condenados por delitos sexuales, desde 1987 Argentina cuenta con un Banco Nacional de Datos Genéticos (BNDG), que fue pionero en el mundo y se constituyó para contribuir a la identificación de niños nacidos en cautiverio durante la última dictadura militar. En 2017, a pedido del BNDG, el equipo de desarrollo de GENis inició la construcción de un módulo especial de búsqueda de personas desaparecidas.

Los casos que usualmente gestiona esa institución presentan pedigrís muy incompletos, lo que deriva en una complejización significativa de los cálculos estadísticos para establecer filiaciones. Luego del trabajo de diversas organizaciones científicas y universidades, se incorporó al software local el módulo MPI, que permite al BNDG realizar mucho más rápidamente la identificación de las personas que buscan su identidad biológica.