Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語
Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語

Desbloqueando nuevo valor comercial con MyScale y Testin: Mejorando el flujo de trabajo de anotación de datos con búsqueda vectorial

# Acerca de Testin

Fundada en 2011, Testin es una plataforma de servicios empresariales que proporciona dos servicios principales: un servicio de pruebas en la nube para desarrolladores, que ha servido a más de 800,000 desarrolladores y realizado más de 150 millones de pruebas para 2 millones de aplicaciones, y un servicio de entrenamiento de modelos de aprendizaje automático (ML) que incluye servicios como anotación de datos y despliegue de modelos en industrias como seguridad y el Internet de las Cosas (IoT). Hasta la fecha, Testin ha colaborado con más de 110 empresas, que van desde fabricantes de automóviles que ofrecen tecnología autónoma de conducción autónoma hasta empresas de hogares inteligentes y finanzas que tratan con aplicaciones de reconocimiento facial y procesamiento de lenguaje natural. Testin también ha recibido varios premios prestigiosos en China, incluyendo las 50 empresas de alta tecnología top de Deloitte China y el Red Herring Global Top 100.

# Antes de usar MyScale

MyScale colaboró con Testin para encontrar nuevas formas de hacer el servicio de anotación de datos de IA lo más útil posible. Un usuario típico de la plataforma de anotación de datos de IA de Testin seguirá los siguientes pasos:

Un usuario primero crea una colección dentro de una biblioteca. Después de eso, se agregan datos a la colección antes de que pueda comenzar la anotación de los datos. La plataforma de anotación de datos de IA luego exporta los datos para su uso en otras aplicaciones, como modelos de aprendizaje automático.

Aunque el proceso de anotación de datos puede parecer simple, puede ser muy lento. Por ejemplo, aunque la función de autoanotación de Testin puede ayudar a los usuarios a ahorrar tiempo en la anotación, no siempre es confiable. Como se ve en la imagen, la plataforma solo pudo identificar un automóvil y no pudo identificar otros automóviles o vehículos más grandes, como un autobús. Debido a la falta de anotaciones consistentes y de alta calidad en todas las imágenes, solo un pequeño número de imágenes tienen anotaciones precisas.

Por otro lado, si un usuario desea anotar, sería un proceso que consume mucho tiempo, aunque la calidad de las anotaciones mejoraría. A lo largo de este proceso, un usuario debe identificar y categorizar manualmente las áreas de una imagen que son relevantes para el coche autónomo. Sin embargo, para la mayoría de los usuarios, anotar manualmente un gran lote de imágenes es poco práctico. Como resultado, a menudo se requiere que los usuarios elijan entre las fotos autoanotadas y mejoren la calidad de las anotaciones.

Otro problema con el proceso actual era que los datos y sus anotaciones no se podían transferir sin problemas de una plataforma a otra. Los usuarios de la plataforma de datos de IA de Testin actualmente no tienen la opción de almacenar todas sus anotaciones en una unidad en la nube de su elección que les permita acceder a ellas. Deben descargar las anotaciones a sus unidades locales antes de poder ejecutar búsquedas de similitud o entrenar sus modelos de IA.

Boost Your AI App Efficiency now
Sign up for free to benefit from 150+ QPS with 5,000,000 vectors
Free Trial
Explore our product

# Aprovechando las funciones de búsqueda vectorial de MyScale en la plataforma de datos de IA de Testin

Como tal, MyScale propuso que Testin considerara dos cambios en su plataforma de datos de IA:

  1. Aprovechar la función de aprendizaje no supervisado de MyScale para muestras pequeñas

  2. Permitir a los usuarios de Testin ejecutar consultas conjuntas en la plataforma MyScale desde dispositivos tanto locales como en la nube.

Para el primero, MyScale permite a los usuarios seleccionar imágenes específicas de los lotes de imágenes con o sin anotaciones para determinar si requieren trabajo adicional en sus anotaciones. Esto significaba que un usuario que utilizaba la función de autoanotación de Testin podría usar MyScale para buscar rápidamente a través del lote de anotaciones e identificar qué imágenes tenían anotaciones buenas/pobres (o ninguna), en lugar de inspeccionar manualmente las imágenes y determinar si los lotes de imágenes tenían buenas coincidencias con una foto de muestra de buena calidad con anotaciones. Esto también es útil al anotar un repositorio de fotos que se actualiza constantemente con nuevas imágenes y datos, ya que usar MyScale elimina la necesidad de que los usuarios revisen las imágenes para determinar si se requieren anotaciones.

Para el segundo, los usuarios pueden usar la función de consulta SQL de la plataforma MyScale para realizar búsquedas de similitud vectorial tanto desde sus cuentas de base de datos en la nube vinculadas como desde los archivos vectoriales que proporcionaron localmente para coincidir con un vector de consulta. Por ejemplo, si la consulta es una foto o texto, MyScale buscará textos y fotos similares, así como videos similares y otras modalidades de datos. Además, cuando se descubrieron dos vectores de alta similitud, Testin utilizó esta función para filtrar datos duplicados.

Join Our Newsletter

# Cómo MyScale puede ayudarte a desbloquear nuevo valor comercial con la búsqueda vectorial

MyScale colaboró con la empresa de pruebas de software Testin para mejorar su flujo de trabajo de etiquetado de datos. Testin utilizó las capacidades de SQL y búsqueda vectorial de alto rendimiento de MyScale para construir sus propias funciones automáticas de anotación de datos y de-duplicación de datos. Aunque la anotación manual de datos es común, también es un cuello de botella para asegurar anotaciones de datos de alta calidad, así como rendimiento en tiempo y costo. MyScale ayudó a Testin a desarrollar funciones automáticas de anotación de datos y de-duplicación de datos utilizando las funciones SQL de MyScale.

Como una base de datos de alto rendimiento adecuada para el desarrollo de modelos y aplicaciones de aprendizaje automático, Testin mejoró su flujo de trabajo de anotación de datos automatizando procesos y reduciendo el tiempo de anotación, el espacio de almacenamiento y el costo.

Si tu empresa también está lidiando con almacenamientos en la nube en tu aplicación actual, y te gustaría explorar más sobre cómo MyScale puede ayudar a extraer más valor de tus aplicaciones y negocios, por favor no dudes en contactarnos en contact@myscale.com.

Keep Reading

Start building your Al projects with MyScale today

Free Trial
Contact Us