Hace dos años, cuando compañías de tecnología china de renombre como Baidu y Alibaba estaban persiguiendo los avances de Silicon Valley en inteligencia artificial con anuncios salpicados y nuevos chatbots, Deepseek adoptó un enfoque diferente. Se centró en la investigación.
La estrategia valió la pena.
La nueva empresa china ha sacudido el mundo tecnológico con su afirmación de que creó un poderoso modelo de IA que era significativamente más barato de construir que las ofertas de sus rivales estadounidenses mejor financiados.
En la rivalidad entre China y los Estados Unidos sobre el dominio de la inteligencia artificial, Deepseek parecía salir de la nada. De hecho, se ha disparado a través del mundo tecnológico de China en los últimos años con un camino que era todo menos convencional.
Su misión de perseguir la investigación refleja la de compañías como OpenAi, la firma de Silicon Valley que marcó una firma estadounidense sobre IA en el otoño de 2022. Pero las similitudes terminan principalmente allí.
Los orígenes de Deepseek están en finanzas, no en la tecnología por el bien de la tecnología. Su empresa matriz, un fondo de cobertura chino llamado High-Flyer, no comenzó como un laboratorio dedicado a salvaguardar a la humanidad de la IA como la IA abierta, sino como un negocio que usa AI para hacer apuestas en el mercado de valores chino.
High-Flyer había prosperado capitalizando un mercado dominado por los inversores minoristas de China, conocidos por entrar y salir de las acciones de manera impulsiva. En 2021, High-Flyer se encontró presionado por las represiones regulatorias en China en el comercio especulativo, que las autoridades de Beijing consideraron que estaba en desacuerdo con sus intentos de mantener la calma de los mercados.
Así que High-Flyer buscó una nueva oportunidad que dijo que se alineó mejor con las prioridades del gobierno chino: AI avanzada
“Queremos hacer cosas con mayor valor y cosas que van más allá de la industria de la inversión, pero se ha malinterpretado como especulación de acciones de IA”, dijo el director ejecutivo de High-Flyer, Lu Zhengzhe, a los medios estatales chinos en 2023. “Hemos creado Un nuevo equipo independiente de la inversión, que es equivalente a una segunda empresa “.
Deepseek nació. Al igual que con muchas otras nuevas empresas chinas, Deepseek llegó a un mercado establecido con un enfoque comercial diferente.
Se cree que el último modelo de Deepseek para la inteligencia artificial es casi tan poderoso como los rivales estadounidenses pero mucho más eficientes. Su éxito sugiere que el plomo de IA de Silicon Valley se ha reducido. El avance de Deepseek, a pesar de los esfuerzos de Washington para limitar el acceso chino a los chips avanzados necesarios para la IA, plantea preguntas sobre cuán efectivos pueden ser esos controles a largo plazo, aunque el fundador de Deepseek ha reconocido que las restricciones de chips son una limitación.
Deepseek no confió en hacer que los productos de IA orientados al consumidor para ingresos, y solo este mes lanzó su primer chatbot, lo que permite a cualquiera generar texto y fotos con comandos simples. En cambio, la compañía usó el dinero que el alto flyer ganó desde el comercio de acciones hasta la investigación ambiciosa de la investigación. El enfoque lo distingue de los rivales estadounidenses, todos los cuales son, en última instancia, compañías de tecnología de consumo.
Este enfoque no convencional también permitió a Deepseek de dejar de lado las estrictas regulaciones que el gobierno chino ha puesto en uso del público. Debido a que su enfoque era investigar y vender a empresas que usan su modelo, y, hasta el lanzamiento de su chatbot este mes, no las aplicaciones de los consumidores, su trabajo temprano no desencadenó las mismas restricciones gubernamentales.
Deepseek está dirigido por su director ejecutivo, Liang Wenfeng, un ingeniero delgado y con gafas que estudió en la Universidad de Zhejiang en la ciudad oriental de Hangzhou. Dijo repetidamente en las pocas entrevistas que ha otorgado a los medios de comunicación chinos que para ponerse al día con la innovación estadounidense, las empresas chinas deben investigar las ganancias. Deepseek y High-Flyer no respondieron a las solicitudes de comentarios.
Lo que las compañías de tecnología chinas “carecen de innovación ciertamente no es capital, sino una falta de confianza y conocimiento sobre cómo organizar una alta densidad de talento para lograr una innovación efectiva”, dijo en un entrevista ampliamente circulada con salida de tecnología china 36kr.
De acuerdo con entrevistas y cuentas públicas.
“Definitivamente es un INTP”, dijo Zihan Wang, un ingeniero informático que trabajó en un modelo anterior de Deepseek, refiriéndose a un tipo de personalidad introspectiva de la prueba de Myers-Briggs, una prueba de personalidad popular entre los jóvenes en China. “Los INTP son realmente buenos investigadores y tienen la voluntad de explorar”, dijo Wang. “Él no es una de esas personas que quiere controlar todo”.
El Sr. Liang no estaba demasiado molesto con detalles como los plazos del proyecto, y ocasionalmente envió preguntas de investigación estimulantes a todo el equipo de investigadores, dijo Wang. Pero sobre todo, el Sr. Liang parecía impulsado a avanzar en la tecnología y no se centró en las ganancias.
A diferencia de muchas empresas chinas, que tienden a centrarse en la contratación de programadores, el Sr. Liang se ha ganado la reputación de emplear personas de fuera de la informática. Poetas y especialidades de humanidades de las principales universidades de China en el personal de Deepseek capacitan al modelo para escribir poesía china clásica y preguntas as tomadas del difícil examen de ingreso a la universidad del país.
“La mayoría del equipo se graduó de las mejores universidades de China”, dijo Yineng Zhang, un ingeniero de software principal en Baseten en San Francisco que trabaja en el Sglang, un proyecto que no es parte de Deepseek que ayuda a las personas a construir sobre el sistema de Deepseek. “Son muy inteligentes y muy jóvenes”.
Durante años, las compañías tecnológicas chinas fueron pioneras en aplicaciones de inteligencia artificial utilizadas en la visión por computadora, como el reconocimiento facial. Pero el lanzamiento de ChatGPT de OpenAI provocó un cálculo. Cuando ninguna compañía china lanzó inmediatamente algo comparable, muchos concluyeron que las compañías estadounidenses tenían una ventaja en AI avanzada
En China, los científicos informáticos estaban decididos a demostrar que podían competir. En 2023, muchas compañías en China publicaron sus propios modelos de idiomas grandes, la tecnología que sustenta chatbots como ChatGPT.
Pero hacer modelos avanzados requeriría usar una gran cantidad de chips que costaran cientos de millones de dólares.
High-Flyer también estaba gastando. Para 2021, era solo un puñado de empresas chinas que habían podido almacenar más de 10,000 chips avanzados NVIDIA A100.
Sin embargo, la investigación de Deepseek le dio una ventaja sorprendente. El año pasado, redujo drásticamente los precios que cobró a los desarrolladores que crean aplicaciones utilizando su modelo, lo que provocó una guerra de precios con rivales más grandes.
El Sr. Wang, el ingeniero que anteriormente trabajó en Deepseek, dijo que hubo poca discusión sobre las aplicaciones comerciales para la tecnología que estaban construyendo. En cambio, dijo, la compañía se centró en hacer un sistema de IA que podría ser utilizado por una variedad de personas para muchos propósitos.
“Durante mi tiempo allí, no hablamos mucho sobre cómo ganamos dinero”, dijo Wang. “Simplemente se centraron en hacer un gran modelo de base”.
Una parte crucial de la popularidad de Deepseek es que ha hecho público el trabajo de sus desarrolladores. Este tipo de intercambio de información, llamado código abierto, ha sido una piedra angular del desarrollo del software informático, Internet y ahora inteligencia artificial.
En los Estados Unidos, los investigadores y empresarios de IA han seguido durante mucho tiempo el progreso de la tecnología de Deepseek. El año pasado, la compañía llamó la atención cuando lanzó sistemas diseñados para generar sus propios programas de computadora.
Un nuevo desafío para la compañía puede venir con su nuevo alto perfil. El mismo día que lanzó R1, el modelo detrás de su nuevo chatbot, la semana pasada, el Sr. Liang apareció en una discusión en la mesa redonda con Li Qiang, el primer ministro de China.
La repentina popularidad de Deepseek lo ha llevado al centro de los esfuerzos del Partido Comunista Chino para estimular la innovación, y eso podría resultar difícil de administrar, dijo Jimmy Goodrich, asesor principal de análisis de tecnología para Rand Corporation, un grupo de expertos financiado por el gobierno federal. “Es una gran situación para Deepseek. Estoy seguro de que no estaban en el plan de cinco años del gobierno, dijo.
“¿Pueden mantener esta visión caótica despreocupada cuando la fiesta y el mundo están mirando?”
Zixu Wang Investigación contribuyó de Hong Kong.