De la fuente de datos al análisis inteligente: la evolución de la tecnología de indexación de datos de la Cadena de bloques
1. Introducción
Desde el nacimiento de las primeras aplicaciones descentralizadas (dApp) en 2017, el ecosistema de aplicaciones de la Cadena de bloques ha crecido de manera próspera. Al discutir estas dApp, ¿alguna vez hemos reflexionado sobre la procedencia de los diversos datos que utilizan?
En 2024, la inteligencia artificial y Web3 se convierten en temas de actualidad. En el campo de la IA, los datos son como la fuente de su crecimiento y evolución. Así como las plantas necesitan luz solar y agua, los sistemas de IA también dependen de grandes cantidades de datos para seguir aprendiendo y pensando. Sin el apoyo de los datos, incluso los algoritmos de IA más avanzados tienen dificultades para alcanzar su potencial.
Este artículo analizará en profundidad la evolución del índice de datos en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques, y comparará los protocolos de índice de datos tradicionales con los nuevos protocolos de servicio de datos de cadena de bloques, explorando las características de los nuevos protocolos que combinan la tecnología de IA en los servicios de datos y la arquitectura de productos.
2. La evolución de la indexación de datos: de nodos de la Cadena de bloques a base de datos de la cadena completa
2.1 Fuente de datos: nodo de la Cadena de bloques
La cadena de bloques a menudo se describe como un libro de contabilidad descentralizado. Los nodos de la cadena de bloques son la base de toda la red, responsables de registrar, almacenar y difundir todos los datos de transacciones en la cadena. Cada nodo posee una copia completa de los datos de la cadena de bloques, manteniendo la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es tarea fácil, ya que no solo requiere habilidades técnicas especializadas, sino que también conlleva altos costos. Al mismo tiempo, la capacidad de consulta de los nodos comunes es limitada, lo que no satisface las necesidades de los desarrolladores. Por lo tanto, los usuarios generalmente dependen de servicios de terceros.
Para resolver este problema, surgieron los proveedores de nodos RPC. Son responsables de la gestión de nodos y proporcionan acceso a datos a través de puntos finales RPC. Los puntos finales RPC públicos son gratuitos pero tienen limitaciones de velocidad, lo que puede afectar la experiencia del usuario de dApp. Los puntos finales RPC privados ofrecen un mejor rendimiento, pero son ineficaces para consultas complejas y difíciles de escalar. Sin embargo, la interfaz API estándar de los proveedores de nodos reduce la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para aplicaciones de datos posteriores.
2.2 Análisis de datos: de datos en bruto a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar encriptados y codificados. Aunque estos datos mantienen la integridad y seguridad de la cadena de bloques, aumentan la dificultad de análisis. Para los usuarios comunes o desarrolladores, tratar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos de cálculo.
El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos originales complejos en un formato más comprensible y manejable, los usuarios pueden utilizar estos datos de manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos de la Cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 Desarrollo del indexador de datos
A medida que aumenta la cantidad de datos de la cadena de bloques, la demanda de indexadores crece cada vez más. Los indexadores son responsables de organizar los datos en la cadena y enviarlos a la base de datos para su consulta. Indexan los datos de la cadena de bloques y proporcionan interfaces API como GraphQL( con un lenguaje de consulta similar a SQL), haciendo que los datos estén disponibles en todo momento. Los indexadores ofrecen a los desarrolladores una interfaz de consulta unificada, simplificando significativamente el proceso de recuperación de datos.
Los diferentes tipos de indexadores optimizan de diversas maneras la recuperación de datos:
Indexador de nodos completos: extrae datos directamente de nodos completos, asegura la integridad de los datos, pero requiere una gran capacidad de almacenamiento y procesamiento.
Indexador ligero: se basa en nodos completos para obtener datos específicos bajo demanda, reduciendo las necesidades de almacenamiento pero puede aumentar el tiempo de consulta.
Indexador especializado: optimizado para tipos específicos de datos o Cadena de bloques, como datos de NFT o transacciones DeFi.
Indexador agregado: extrae datos de múltiples cadenas de bloques y fuentes, incluyendo información fuera de la cadena, proporcionando una interfaz de consulta unificada, adecuada para dApps de múltiples cadenas.
En la actualidad, las necesidades de almacenamiento de los nodos de archivo de Ethereum varían considerablemente entre diferentes clientes. Ante la gran cantidad de datos, los protocolos de indexación más utilizados no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicaciones.
La aparición de los indexadores ha mejorado significativamente la eficiencia de la indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden indexar eficientemente grandes cantidades de datos, soportando consultas complejas de alta velocidad y filtrado de datos. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las dApps de múltiples cadenas desplieguen múltiples API. La operación distribuida proporciona una mayor seguridad y rendimiento, reduciendo los riesgos que pueden surgir de los proveedores RPC centralizados.
2.4 Base de datos de toda la cadena: alineación prioritaria hacia el flujo
El uso de nodos de índice para consultar datos generalmente convierte la API en el único portal para digerir datos en la cadena de bloques. Sin embargo, cuando los proyectos entran en la fase de expansión, a menudo se necesitan fuentes de datos más flexibles. A medida que las demandas de las aplicaciones se complican, los indexadores de datos primarios tienen dificultades para satisfacer las diversas necesidades de consulta, como la búsqueda, el acceso entre cadenas o el mapeo de datos fuera de la cadena.
En la arquitectura moderna de tuberías de datos, el enfoque "prioritario al flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, permitiendo el procesamiento y análisis de datos en tiempo real. Los proveedores de servicios de datos de cadena de bloques también están avanzando hacia la construcción de flujos de datos, lanzando productos que obtienen datos de cadena de bloques en tiempo real de manera de flujo de datos.
Estos servicios están diseñados para abordar la necesidad de analizar transacciones en la cadena de bloques en tiempo real y proporcionar capacidades de consulta completas. Al redefinir los desafíos de los datos en la cadena a través de la perspectiva de tuberías de datos modernas, podemos ver el potencial de la gestión, almacenamiento y provisión de datos en la cadena desde una nueva perspectiva.
3. La combinación de AI y bases de datos: comparación de The Graph, Chainbase y Space and Time
3.1 The Graph
La red The Graph logra la indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de dApps. Sus principales modelos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, sirviendo a las necesidades de consulta de productos de los usuarios.
El subgráfico es la estructura de datos fundamental de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que aseguran el funcionamiento del sistema a través de incentivos económicos.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Herramientas desarrolladas por Semiotic Labs como AutoAgora, Allocation Optimizer y AgentC optimizan respectivamente las estrategias de precios, la asignación de recursos y la experiencia del usuario, mejorando la inteligencia del sistema y la amigabilidad con el usuario.
3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus características incluyen:
Lago de datos en tiempo real: proporciona un lago de datos en tiempo real especializado para flujos de datos de cadena de bloques.
Arquitectura de doble cadena: capa de ejecución construida sobre Eigenlayer AVS, formando una arquitectura paralela con el algoritmo de consenso CometBFT.
Estándar de formato de datos innovador: introducción del estándar de formato de datos "manuscripts".
Modelo de mundo criptográfico: combinando tecnología de modelos de IA, creando el modelo de IA Theia que puede entender y predecir las transacciones de la Cadena de bloques.
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando el análisis de datos en cadena y fuera de cadena con un modo de cifrado, para proporcionar servicios de datos inteligentes a los usuarios.
3.3 Espacio y Tiempo
Space and Time (SxT) se dedica a crear una capa de cálculo verificable, ampliando pruebas de conocimiento cero sobre un almacén de datos descentralizado. Su tecnología innovadora Proof of SQL asegura la inmutabilidad y verificabilidad de las consultas SQL, proporcionando soluciones para industrias con altas demandas de confiabilidad de datos.
SxT se asocia con el laboratorio de innovación de IA de Microsoft para desarrollar herramientas de IA generativa, facilitando a los usuarios el procesamiento de datos de la cadena de bloques a través del lenguaje natural. Los usuarios pueden experimentar en Space and Time Studio cómo la IA convierte automáticamente el lenguaje natural en SQL y ejecuta consultas.
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde el origen de los datos en los nodos, pasando por el desarrollo de la解析 de datos y el indexador, hasta llegar a un servicio de datos de cadena completo potenciado por IA, experimentando un proceso de mejora gradual. Esta evolución tecnológica no solo ha mejorado la eficiencia y precisión del acceso a los datos, sino que también ha brindado una experiencia inteligente.
En el futuro, con el desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán apoyando el avance y la innovación en la industria.
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
8 me gusta
Recompensa
8
6
Compartir
Comentar
0/400
SerLiquidated
· hace8h
Los datos son el rey, el futuro es prometedor.
Ver originalesResponder0
GasFeeLady
· hace8h
La tecnología siempre proviene de la naturaleza humana
Evolución del índice de datos de la cadena de bloques: de nodos a servicios de cadena completos potenciados por IA
De la fuente de datos al análisis inteligente: la evolución de la tecnología de indexación de datos de la Cadena de bloques
1. Introducción
Desde el nacimiento de las primeras aplicaciones descentralizadas (dApp) en 2017, el ecosistema de aplicaciones de la Cadena de bloques ha crecido de manera próspera. Al discutir estas dApp, ¿alguna vez hemos reflexionado sobre la procedencia de los diversos datos que utilizan?
En 2024, la inteligencia artificial y Web3 se convierten en temas de actualidad. En el campo de la IA, los datos son como la fuente de su crecimiento y evolución. Así como las plantas necesitan luz solar y agua, los sistemas de IA también dependen de grandes cantidades de datos para seguir aprendiendo y pensando. Sin el apoyo de los datos, incluso los algoritmos de IA más avanzados tienen dificultades para alcanzar su potencial.
Este artículo analizará en profundidad la evolución del índice de datos en el proceso de desarrollo de la industria desde la perspectiva de la accesibilidad de los datos de la cadena de bloques, y comparará los protocolos de índice de datos tradicionales con los nuevos protocolos de servicio de datos de cadena de bloques, explorando las características de los nuevos protocolos que combinan la tecnología de IA en los servicios de datos y la arquitectura de productos.
2. La evolución de la indexación de datos: de nodos de la Cadena de bloques a base de datos de la cadena completa
2.1 Fuente de datos: nodo de la Cadena de bloques
La cadena de bloques a menudo se describe como un libro de contabilidad descentralizado. Los nodos de la cadena de bloques son la base de toda la red, responsables de registrar, almacenar y difundir todos los datos de transacciones en la cadena. Cada nodo posee una copia completa de los datos de la cadena de bloques, manteniendo la característica de descentralización de la red. Sin embargo, para los usuarios comunes, construir y mantener un nodo no es tarea fácil, ya que no solo requiere habilidades técnicas especializadas, sino que también conlleva altos costos. Al mismo tiempo, la capacidad de consulta de los nodos comunes es limitada, lo que no satisface las necesidades de los desarrolladores. Por lo tanto, los usuarios generalmente dependen de servicios de terceros.
Para resolver este problema, surgieron los proveedores de nodos RPC. Son responsables de la gestión de nodos y proporcionan acceso a datos a través de puntos finales RPC. Los puntos finales RPC públicos son gratuitos pero tienen limitaciones de velocidad, lo que puede afectar la experiencia del usuario de dApp. Los puntos finales RPC privados ofrecen un mejor rendimiento, pero son ineficaces para consultas complejas y difíciles de escalar. Sin embargo, la interfaz API estándar de los proveedores de nodos reduce la barrera de acceso de los usuarios a los datos en la cadena, sentando las bases para aplicaciones de datos posteriores.
2.2 Análisis de datos: de datos en bruto a datos utilizables
Los datos originales proporcionados por los nodos de la cadena de bloques suelen estar encriptados y codificados. Aunque estos datos mantienen la integridad y seguridad de la cadena de bloques, aumentan la dificultad de análisis. Para los usuarios comunes o desarrolladores, tratar estos datos directamente requiere una gran cantidad de conocimientos técnicos y recursos de cálculo.
El proceso de análisis de datos se vuelve especialmente importante en este contexto. Al convertir datos originales complejos en un formato más comprensible y manejable, los usuarios pueden utilizar estos datos de manera más intuitiva. La calidad del análisis afecta directamente la eficiencia y efectividad de las aplicaciones de datos de la Cadena de bloques, siendo un eslabón clave en todo el proceso de indexación de datos.
2.3 Desarrollo del indexador de datos
A medida que aumenta la cantidad de datos de la cadena de bloques, la demanda de indexadores crece cada vez más. Los indexadores son responsables de organizar los datos en la cadena y enviarlos a la base de datos para su consulta. Indexan los datos de la cadena de bloques y proporcionan interfaces API como GraphQL( con un lenguaje de consulta similar a SQL), haciendo que los datos estén disponibles en todo momento. Los indexadores ofrecen a los desarrolladores una interfaz de consulta unificada, simplificando significativamente el proceso de recuperación de datos.
Los diferentes tipos de indexadores optimizan de diversas maneras la recuperación de datos:
En la actualidad, las necesidades de almacenamiento de los nodos de archivo de Ethereum varían considerablemente entre diferentes clientes. Ante la gran cantidad de datos, los protocolos de indexación más utilizados no solo admiten la indexación de múltiples cadenas, sino que también han personalizado marcos de análisis de datos para diferentes necesidades de aplicaciones.
La aparición de los indexadores ha mejorado significativamente la eficiencia de la indexación y consulta de datos. En comparación con los puntos finales RPC tradicionales, los indexadores pueden indexar eficientemente grandes cantidades de datos, soportando consultas complejas de alta velocidad y filtrado de datos. Algunos indexadores también soportan la agregación de múltiples fuentes de datos de cadenas de bloques, evitando el problema de que las dApps de múltiples cadenas desplieguen múltiples API. La operación distribuida proporciona una mayor seguridad y rendimiento, reduciendo los riesgos que pueden surgir de los proveedores RPC centralizados.
2.4 Base de datos de toda la cadena: alineación prioritaria hacia el flujo
El uso de nodos de índice para consultar datos generalmente convierte la API en el único portal para digerir datos en la cadena de bloques. Sin embargo, cuando los proyectos entran en la fase de expansión, a menudo se necesitan fuentes de datos más flexibles. A medida que las demandas de las aplicaciones se complican, los indexadores de datos primarios tienen dificultades para satisfacer las diversas necesidades de consulta, como la búsqueda, el acceso entre cadenas o el mapeo de datos fuera de la cadena.
En la arquitectura moderna de tuberías de datos, el enfoque "prioritario al flujo" se ha convertido en una solución para las limitaciones del procesamiento por lotes tradicional, permitiendo el procesamiento y análisis de datos en tiempo real. Los proveedores de servicios de datos de cadena de bloques también están avanzando hacia la construcción de flujos de datos, lanzando productos que obtienen datos de cadena de bloques en tiempo real de manera de flujo de datos.
Estos servicios están diseñados para abordar la necesidad de analizar transacciones en la cadena de bloques en tiempo real y proporcionar capacidades de consulta completas. Al redefinir los desafíos de los datos en la cadena a través de la perspectiva de tuberías de datos modernas, podemos ver el potencial de la gestión, almacenamiento y provisión de datos en la cadena desde una nueva perspectiva.
3. La combinación de AI y bases de datos: comparación de The Graph, Chainbase y Space and Time
3.1 The Graph
La red The Graph logra la indexación y consulta de datos multichain a través de una red de nodos descentralizados, facilitando a los desarrolladores la indexación de datos de la cadena de bloques y la construcción de dApps. Sus principales modelos de producto incluyen el mercado de ejecución de consultas de datos y el mercado de caché de indexación de datos, sirviendo a las necesidades de consulta de productos de los usuarios.
El subgráfico es la estructura de datos fundamental de la red The Graph, que define cómo extraer y transformar datos de la cadena de bloques en un formato consultable. La red está compuesta por cuatro roles clave: indexadores, curadores, delegadores y desarrolladores, que aseguran el funcionamiento del sistema a través de incentivos económicos.
Los productos de The Graph también están evolucionando rápidamente en la ola de la IA. Herramientas desarrolladas por Semiotic Labs como AutoAgora, Allocation Optimizer y AgentC optimizan respectivamente las estrategias de precios, la asignación de recursos y la experiencia del usuario, mejorando la inteligencia del sistema y la amigabilidad con el usuario.
3.2 Chainbase
Chainbase es una red de datos de cadena completa que integra todos los datos de la cadena de bloques en una plataforma. Sus características incluyen:
El modelo de IA Theia de Chainbase se basa en el modelo DORA de NVIDIA, combinando el análisis de datos en cadena y fuera de cadena con un modo de cifrado, para proporcionar servicios de datos inteligentes a los usuarios.
3.3 Espacio y Tiempo
Space and Time (SxT) se dedica a crear una capa de cálculo verificable, ampliando pruebas de conocimiento cero sobre un almacén de datos descentralizado. Su tecnología innovadora Proof of SQL asegura la inmutabilidad y verificabilidad de las consultas SQL, proporcionando soluciones para industrias con altas demandas de confiabilidad de datos.
SxT se asocia con el laboratorio de innovación de IA de Microsoft para desarrollar herramientas de IA generativa, facilitando a los usuarios el procesamiento de datos de la cadena de bloques a través del lenguaje natural. Los usuarios pueden experimentar en Space and Time Studio cómo la IA convierte automáticamente el lenguaje natural en SQL y ejecuta consultas.
Conclusión y perspectivas
La tecnología de indexación de datos de la cadena de bloques ha evolucionado desde el origen de los datos en los nodos, pasando por el desarrollo de la解析 de datos y el indexador, hasta llegar a un servicio de datos de cadena completo potenciado por IA, experimentando un proceso de mejora gradual. Esta evolución tecnológica no solo ha mejorado la eficiencia y precisión del acceso a los datos, sino que también ha brindado una experiencia inteligente.
En el futuro, con el desarrollo de nuevas tecnologías como la inteligencia artificial y las pruebas de conocimiento cero, los servicios de datos de la cadena de bloques se volverán aún más inteligentes y seguros. Como infraestructura, los servicios de datos de la cadena de bloques seguirán apoyando el avance y la innovación en la industria.