La inteligencia artificial y el aprendizaje de las máquinas ('machine learning') están descubriendo nuevos elementos de diagnóstico que hasta ahora habían pasado desapercibidos para los investigadores.
Y es que la capacidad de cálculo de los superordenadores con datos masivos ('big data') permite que se encuentren nuevas coincidencias entre individuos afectados por el mismo mal o fármacos utilizados para tratarlo. Hasta ahora se han conseguido datos nuevos del párkinson y la diabetes de tipo 2, pero extenderlo a nuevas enfermedades es uno de los retos de la bioinformática como disciplina.
Un estudio del Barcelona Supercomputing Center (BSC) publicado en la revista 'Nature Communications' sobre datos de 70.000 individuos existentes en bases públicas ha permitido identificar siete nuevas regiones del genoma asociadas a un mayor riesgo de padecer diabetes de tipo 2, y otra investigación conjunta con el Centro de Regulación Genómica (CRG), también en Barcelona, ha descubierto un mecanismo que regula la expresión de la proteína alfa-sinucleína en la enfermedad de Parkinson y la atrofia multisistémica, una dolencia considerada rara que mina el sistema nervioso.
En el caso de la diabetes de tipo 2, los investigadores del BSC destacan que hasta ahora ya estaban identificados casi un centenar de patrones genéticos asociados, pero que daban un riesgo de padecerla de entre el 5% y el 30%. El nuevo rasgo genético descubierto, un marcador raro en el cromosoma X, eleva el riesgo de padecer la enfermedad al 200% en varones, aunque no tienen aún claro por qué solo les afecta a ellos, si porque tienen el cromosoma más identificado o porque son los únicos susceptibles. Lo que sí está claro es que señala al gen AGTR2 como posible diana para tratamientos eficientes, afirman los autores del estudio, Silvia Bonàs y otros, dirigidos por Josep Mercader y David Torrents. Hasta ahora, recuerdan, el cromosoma X no se contemplaba en muchos estudios, pese a que afecta al 5% del genoma humano.
Echar imaginación
Y es que las capacidades de los superordenadores permiten a los investigadores echar imaginación y tener en cuenta detalles que hasta ahora pasaban desapercibidos. "Hay muchos estudios que utilizan datos muy difíciles de obtener solo para sus propias conclusiones y esas muestras pueden tener una segunda vida en otras investigaciones. Al ver los datos desde otra perspectiva descubres cosas que no se han visto antes y que relacionan enfermedades o efectos. Es plantearse nuevas preguntas desde otro punto de vista", afirma Alfonso Valencia, director del área de ciencias de la vida del BSC y catedrático ICREA.
El investigador, presidente también de la Sociedad Internacional de Biología Computacional, señala que esta nueva perspectiva permite averiguar más sobre la comorbilidad, esto es cómo una enfermedad influye en la posibilidad de tener otra, o para descubrir cómo fármacos que se usan para una enfermedad pueden actuar para otra.
Este reaprovechamiento es lo que se conoce como "investigación parasitaria", un término creado por el 'New England Journal of Medicine', una de las revistas científicas más prestigiosas del mundo, para denostar la práctica de reutilizar datos médicos (caros y difíciles de obtener). Una práctica que sin embargo ha logrado ganarse el respeto de la comunidad científica por los descubrimientos que supone. "Los autores se retractaron después porque la comunidad bioinformática lo vivió como insulto, aunque luego se han creado unos premios anuales que se conceden a los mejores trabajos", señala.
Profesionales en la sombra
"Los datos que usamos son los de las grandes bases, las imágenes, la información de historiales médicos y la que brindan los pacientes a dispositivos conectados", señala Valencia. Toda la información obtenida se contrasta con la que existe en la European Genome-Phenome Archive (EGA), un repositorio con toda la información existente del genoma humano y sus enfermedades que mantienen investigadores de Barcelona (BSC) y Cambridge.
Para los científicos, generar esos datos es vital y reclaman que se prestigie a quienes los obtienen: los llamados 'biocurators'. "En una investigación se reconoce más el trabajo del que analiza los datos que el del que los recopila. Esto es preocupante porque la biología informática vive de mantener un conjunto de datos y sus profesionales no ven desarrollarse sus carreras porque no publican".
Problemas para conseguir datos
Disponer de datos médicos para analizarlos en investigación no es sencillo. Los investigadores han de cumplimentar muchos requisitos administrativos y legales porque es información considerada muy sensible. De hecho, en España está prohibido captarla y procesarla sin autorización expresa del paciente. Además, las leyes exigen que estén anonimizados, se destinen exclusivamente al uso para el que se piden y se destruyan posteriormente.
La comunidad de la bioinformática reclama mantener esa información y que las grandes corporaciones hospitalarias dejen de considerarla patrimonio propio. "Los tratamos anonimizados, pero hay el mito de que se puede llegar a saber quién es el paciente cruzando información. Ningún científico se va a poner a cruzar eso. Son excusas”, sostiene Valencia.