DeepSeek rompe las barreras tecnológicas de la IA y provoca temblores en el mercado de valores de EE. UU.

robot
Generación de resúmenes en curso

La ola de IA arrasa el mundo, DeepSeek surge inesperadamente y provoca un temblor en el mercado

Recientemente, ha ocurrido un evento notable en el campo de la IA. Un modelo de IA chino llamado DeepSeek ha superado por primera vez a ChatGPT en descargas en la App Store de EE. UU., alcanzando el primer lugar. Este fenómeno no solo ha suscitado un amplio interés en la comunidad tecnológica, de inversión y de medios a nivel mundial, sino que también ha provocado una breve sensación de pánico en el mercado de capitales estadounidense.

Como resultado, las acciones de varias empresas tecnológicas han caído en diferentes grados. Nvidia cayó un 5.3%, ARM un 5.5%, Broadcom un 4.9% y TSMC un 4.5%. Otras empresas como Micron, AMD e Intel también experimentaron caídas correspondientes. Los futuros del Nasdaq 100 cayeron a -400 puntos, lo que podría marcar la mayor caída diaria desde el 18 de diciembre. Según estimaciones incompletas, el valor de mercado de la bolsa estadounidense podría evaporarse en más de un billón de dólares durante las transacciones del lunes, lo que equivale a un tercio del valor total del mercado de criptomonedas.

El mercado de criptomonedas tampoco se ha librado de esta tendencia a la baja. El precio de Bitcoin ha caído por debajo de 100500 dólares, con una caída del 4.48% en 24 horas. Ethereum ha bajado de 3200 dólares, con una disminución del 3.83% en 24 horas. Muchos inversores se sienten confundidos por esta repentina fluctuación del mercado, y algunos creen que podría estar relacionado con la disminución de las expectativas de recortes de tasas por parte de la Reserva Federal o otros factores macroeconómicos.

DeepSeek está en auge, ¿se ha desplomado el mercado de Crypto?

El auge de DeepSeek ha llevado a una reconsideración del modelo de desarrollo de la IA. A diferencia de empresas como OpenAI y Meta, DeepSeek no se ha desarrollado gracias a un fuerte capital y una gran cantidad de recursos de hardware. En comparación, OpenAI fue fundada hace 10 años, cuenta con 4500 empleados y ha recaudado 6.6 mil millones de dólares. Una determinada empresa de redes sociales ha gastado 60 mil millones de dólares en desarrollar un centro de datos de IA del tamaño de Manhattan. En cambio, DeepSeek se fundó hace menos de 2 años, tiene solo 200 empleados, su costo de desarrollo es de menos de 10 millones de dólares y no ha adquirido grandes cantidades de GPU de alta gama.

Esta disparidad lleva a los profesionales de la industria a preguntarse: ¿cómo pueden los gigantes tecnológicos tradicionales competir con DeepSeek? El éxito de DeepSeek no solo refleja una ventaja de costos en términos de capital y tecnología, sino que también desafía las nociones preconcebidas sobre el desarrollo de la IA.

El vicepresidente de productos de una conocida empresa de tecnología comentó en las redes sociales que la historia de DeepSeek ejemplifica la típica innovación disruptiva. Las empresas existentes están optimizando los procesos actuales, mientras que los disruptores replantean los métodos básicos. DeepSeek propone una nueva idea: ¿qué pasaría si hiciéramos esto de manera más inteligente, en lugar de simplemente invertir en más hardware?

Actualmente, el costo de entrenar modelos de IA de última generación es extremadamente alto. Algunas de las principales empresas de IA gastan más de 100 millones de dólares solo en computación, necesitando grandes centros de datos equipados con miles de GPU valoradas en 40,000 dólares cada una. Sin embargo, DeepSeek ha propuesto una solución sorprendente: completar esta tarea con 5 millones de dólares. Lo más sorprendente es que no solo propusieron esta idea, sino que realmente la llevaron a cabo. Sus modelos son comparables o incluso superiores a los sistemas de IA líderes en la industria en muchas tareas.

El éxito de DeepSeek proviene de su enfoque en repensar todo desde cero. Los modelos de IA tradicionales utilizan decimales de 32 bits para representar cada número, mientras que DeepSeek intenta usar decimales de 8 bits y descubrió que la precisión sigue siendo suficiente. Este cambio redujo la memoria requerida en un 75%. Como resultado, el costo de entrenamiento se redujo de 100 millones de dólares a 5 millones de dólares, la cantidad de GPU necesarias disminuyó de 100,000 a 2,000, y el costo de la API se redujo en un 95%. Más importante aún, su modelo puede funcionar en GPU de juegos comunes, sin necesidad de hardware especializado en centros de datos.

El éxito de DeepSeek desafía múltiples conceptos tradicionales en el campo de la IA, incluyendo la creencia de que China solo puede hacer código fuente cerrado, la posición de liderazgo absoluto de Silicon Valley en el campo de la IA, y la necesidad de enormes inversiones para desarrollar modelos de IA de primer nivel. Estas opiniones, aunque no han sido completamente refutadas, han sido seriamente sacudidas.

Una conocida institución de inversión en acciones de EE. UU. comentó en su informe sobre DeepSeek, señalando que esto representa una victoria del código abierto frente al código cerrado. Las contribuciones de la comunidad de código abierto pueden transformarse rápidamente en la prosperidad de todo el ecosistema. Al mismo tiempo, también creen que, aunque el camino de desarrollo de las empresas de IA tradicionales parece simple y brutal, no se puede descartar que, al alcanzar cierta escala, aparezcan nuevas transformaciones cualitativas. A partir de la historia del desarrollo de la IA en los últimos 70 años, la potencia de cálculo sigue siendo crucial, y esto podría seguir siendo aplicable en el futuro.

La aparición de DeepSeek ha llevado a los modelos de código abierto a alcanzar niveles comparables a los de los modelos de código cerrado, e incluso los supera en eficiencia. Esto ha reducido la necesidad de que las empresas compren API de IA comerciales, proporcionando un mayor espacio para el desarrollo de aplicaciones. Se espera que en los próximos uno o dos años, seamos testigos de productos de chips de inferencia más ricos y de un ecosistema de aplicaciones de modelos de lenguaje grande más próspero.

A pesar de que DeepSeek ha mostrado una eficiencia muy alta, los expertos creen que la demanda de potencia de cálculo no disminuirá. Esto se alinea con la paradoja de Jevons en economía, que establece que el aumento de la eficiencia tecnológica puede, de hecho, aumentar el consumo total de recursos. Al igual que en el proceso de la transición de los teléfonos móviles grandes a la popularización de los teléfonos Nokia, fue gracias a la reducción de costos que se logró la difusión, y esta difusión a su vez llevó a un aumento en el consumo total del mercado.

Este importante avance en la tecnología de IA sin duda tendrá un profundo impacto en el panorama tecnológico global y también proporciona nuevas ideas para la dirección futura del desarrollo de la IA. A medida que la tecnología continúa evolucionando, esperamos ver más innovaciones y avances que impulsen el campo de la IA hacia un desarrollo más eficiente y generalizado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Compartir
Comentar
0/400
ContractFreelancervip
· hace12h
GPT esta vez condenado
Ver originalesResponder0
LuckyBlindCatvip
· hace12h
Golpeó el punto crítico de las grandes empresas.
Ver originalesResponder0
WhaleStalkervip
· hace12h
¡El Código abierto es el camino correcto!
Ver originalesResponder0
BankruptcyArtistvip
· hace13h
Otro que viene a aprovechar la fama.
Ver originalesResponder0
LightningLadyvip
· hace13h
No lo creo ni muerto.
Ver originalesResponder0
BlockchainDecodervip
· hace13h
Desde la perspectiva de la teoría de la arquitectura de IA, el punto de ruptura de DeepSeek está en la optimización del algoritmo de base, con referencia a los datos del artículo de la conferencia AAAI 2023.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)