
Basecamp Research revoluciona la biología con IA para diseño de proteínas y nuevos organismos
- curecompass
- 12 abril, 2025
- I+D, Medicina, Tecnología
- ADN, AlphaFold, Basecamp Research, Genomas, Google DeepMind, Portada
- 0 Comments
La startup londinense Basecamp Research presentó BaseFold, un modelo de inteligencia artificial que supera a AlphaFold2 en la predicción de estructuras proteicas, acercándose al objetivo de diseñar proteínas y organismos a medida.
En 2018, Deepmind, el laboratorio de inteligencia artificial de Google, lanzó un algoritmo que revolucionó el mundo de la biología. Llamado AlphaFold, el software fue capaz de predecir con precisión las estructuras de las proteínas, un problema complejo que se consideró un gran avance científico.
Comprender cómo interactúan las proteínas es clave para comprender todos los aspectos de la biotecnología, desde cómo mejorar el sabor de los alimentos hasta cómo lograr que los cultivos sobrevivan al cambio climático y la cura del cáncer.
Desde su lanzamiento, AlphaFold, su sucesor, AlphaFold2, y los cientos de millones de estructuras de proteínas que ha generado en los últimos años se han convertido en una herramienta clave para los investigadores de biotecnología de todo el mundo.

Si bien AlphaFold ha impulsado la industria, presenta sus propias limitaciones. Los investigadores aún están lejos de alcanzar el Santo Grial de la biología sintética: un modelo de IA capaz de adoptar la forma deseada de una proteína y descubrir cómo crearla, ya sea encontrando la sustancia química adecuada para interactuar con ella o diseñando completamente una proteína que no se encuentra en la naturaleza.
Hoy, científicos de Basecamp Research, con sede en Londres, anunciaron que están un paso más cerca de lograr ese objetivo gracias a un nuevo modelo de IA basado en los algoritmos de código abierto de AlphaFold2.
Basecamp afirma que su modelo, BaseFold, entrenado con un conjunto de datos mucho más amplio, puede generar predicciones de la estructura de proteínas más precisas que AlphaFold2.
La compañía también anunció que colaborará con Nvidia para optimizar BaseFold y su uso con BioNeMo, la plataforma de IA generativa del gigante de los chips para el descubrimiento de fármacos.
Glen Gowers, cofundador y director ejecutivo de Basecamp, afirma que su software triplica la predicción de cómo cambiarán las estructuras de las proteínas al interactuar con moléculas pequeñas, un dato clave en el proceso de descubrimiento de fármacos.
La compañía publicó un artículo con sus resultados, que aún no han sido revisados por pares, en el servidor de preimpresión bioRxiv. Hasta la fecha, ha recaudado un total de 25 millones de dólares en capital y tiene una valoración de 71 millones de dólares, según Pitchbook.
Si bien este es un hito importante para la startup de cuatro años, Gowers, de 29 años, cree que el software lo acerca un paso más a su objetivo final: diseñar proteínas, o incluso nuevos organismos, para satisfacer las necesidades de sus clientes. “No buscamos ser solo una empresa de estructura de proteínas”, declaró a Forbes . “Lo estamos aplicando ampliamente en cualquier tarea generativa o predictiva. Por ejemplo, en aspectos como la adaptación de la función de las proteínas, la generación de nuevas proteínas e incluso la generación de nuevos genomas”.
A Gowers se le ocurrió la idea de Basecamp en 2019, cuando él y otros investigadores pasaron un mes en Islandia, viviendo desconectados de la red. Dedicaron sus días a secuenciar los genomas de un conjunto especial de microorganismos que habían evolucionado para sobrevivir tanto al calor como al frío extremos gracias a su proximidad al hielo y a una fuente termal.
La mayoría de los datos que su equipo recopiló en un mes eran «materia oscura de proteínas desconocidas, secuencias desconocidas de origen desconocido», explicó. Estos datos le ayudaron a comprender que los conjuntos de datos genómicos disponibles públicamente con los que AlphaFold se ha entrenado equivalen a unas cinco gotas de agua en especies, en comparación con el total conocido del océano Atlántico.
El gran volumen de datos sobre proteínas es crucial para predecir cómo se plegarán estos componentes básicos de la vida, ya que existen tantas variables que pueden determinar su comportamiento, tantas que es casi imposible calcularlas directamente debido a la complejidad matemática. Sin embargo, si un modelo de aprendizaje automático se entrena con miles de millones de estructuras diferentes, surgen patrones que le permiten predecir con mayor precisión cómo se plegará una proteína determinada.
Piénsalo como los chatbots de IA que han surgido en los últimos años. Entrena a un bot en un subconjunto pequeño del lenguaje humano, como, por ejemplo, Twitter, y descubrirás, como hizo Microsoft en 2016, que se vuelve un completo demente.
ChatGPT y sus competidores, en cambio, se entrenan en partes mucho más grandes y diversas de internet, lo que resulta en bots que responden mejor a las preguntas y son menos propensos a insultarte. De igual manera, recopilar un conjunto mucho más amplio y diverso de datos genómicos permite predecir mejor el plegamiento de las proteínas.
Por eso, Basecamp ha trabajado para diversificar el conjunto de datos de proteínas con el que entrenan sus modelos. Desde su fundación en 2020, Basecamp ha colaborado con investigadores de todo el mundo para secuenciar información genómica de alta calidad de decenas de millones de microbios, plantas y animales de todo el mundo. Estos investigadores, a su vez, reciben regalías de los ingresos generados por Basecamp por los datos.
Además de secuenciar el ADN de estos organismos, los investigadores también recopilan información contextual, lo que proporciona aún más datos que la IA puede usar para explicar por qué las proteínas se pliegan de la forma en que lo hacen. “Con cada entrada en nuestra base de datos, recopilamos cientos de dimensiones adicionales”, afirmó Phillip Lorenz, de 31 años, director de tecnología de la compañía.
Esto incluye las temperaturas locales, el pH, la salinidad del agua donde se encontraron los organismos, la cantidad de luz disponible para ellos y más. La geografía donde se encuentran estas muestras también es increíblemente diversa, añadió, desde cuevas en Hungría hasta respiraderos oceánicos de aguas profundas. “Visitamos todos los biomas del mundo, desde islas volcánicas hasta la Antártida”.
Basecamp ya genera ingresos, según declaró Gowers, utilizando su modelado predictivo para resolver los problemas de los clientes (se negó a compartir cifras). Por ejemplo, colabora con la empresa británica Colorfix para diseñar nuevas proteínas que puedan utilizarse para teñir telas sin usar productos químicos agresivos.
También ayuda a la startup Protein Evolution, con sede en Connecticut, a descubrir nuevas proteínas capaces de descomponer plásticos para su reciclaje. Además, Gowers espera utilizar su capacidad computacional para desarrollar nuevos fármacos en colaboración con compañías farmacéuticas.
Dicho esto, Gowers admite que la empresa no puede mantenerse en esta situación indefinidamente. Para competir con rivales mejor capitalizados, Basecamp planea captar más inversión próximamente. “Entrenar nuevos modelos y construir nuevas arquitecturas, sobre todo cuando los datos son extremadamente grandes, es un negocio extremadamente costoso”, afirmó.
Fuente: IABizz.com