Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語
Sign In
Free Sign Up
  • English
  • Español
  • 简体中文
  • Deutsch
  • 日本語

Neuen Geschäftswert mit MyScale und Testin erschließen: Verbesserung des Datenannotations-Workflows mit Vektorsuche

# Über Testin

Testin wurde 2011 gegründet und ist eine Unternehmensdienstplattform, die zwei Hauptdienste anbietet: einen Cloud-Testservice für Entwickler, der bereits über 800.000 Entwicklern gedient hat und mehr als 150 Millionen Tests für 2 Millionen Apps durchgeführt hat, sowie einen Machine-Learning-Modelltrainingsservice, der Dienstleistungen wie Datenannotation und Modellbereitstellung in Branchen wie Sicherheit und Internet der Dinge (IoT) umfasst. Testin hat bisher mit über 110 Unternehmen zusammengearbeitet, darunter Automobilhersteller, die selbstfahrende autonome Technologie anbieten, sowie Smart-Home- und Finanzunternehmen, die sich mit Anwendungen für Gesichtserkennung und natürliche Sprachverarbeitung befassen. Testin hat auch mehrere renommierte Auszeichnungen in China erhalten, darunter Deloitte Chinas Top 50 High-Tech-Unternehmen und Red Herring Global Top 100.

# Vor der Verwendung von MyScale

MyScale hat mit Testin zusammengearbeitet, um neue Möglichkeiten zu finden, den KI-Datenannotationsdienst so nützlich wie möglich zu gestalten. Ein typischer Benutzer der Testin-KI-Datenannotationsplattform durchläuft die folgenden Schritte:

Ein Benutzer erstellt zunächst eine Sammlung innerhalb einer Bibliothek. Anschließend wird den Sammlungen Daten hinzugefügt, bevor mit der Annotation der Daten begonnen werden kann. Die KI-Datenannotationsplattform exportiert dann die Daten zur Verwendung in anderen Anwendungen, wie zum Beispiel für maschinelle Lernmodelle.

Obwohl der Prozess der Datenannotation einfach erscheinen mag, kann er zeitaufwändig sein. Zum Beispiel kann die Auto-Annotationsfunktion von Testin Benutzern zwar dabei helfen, Zeit bei der Annotation zu sparen, ist aber nicht immer zuverlässig. Wie im Bild zu sehen ist, konnte die Plattform nur ein Auto identifizieren und konnte andere Autos oder größere Fahrzeuge wie einen Bus nicht identifizieren. Aufgrund des Mangels an konsistenten, hochwertigen Annotationen in allen Bildern haben nur eine geringe Anzahl von Bildern genaue Annotationen.

Auf der anderen Seite wäre es zeitaufwändig, wenn ein Benutzer annotieren möchte, obwohl die Qualität der Annotationen verbessert würde. Im Laufe dieses Prozesses muss ein Benutzer manuell die Bereiche eines Bildes identifizieren und kategorisieren, die für das selbstfahrende Auto relevant sind. Für die meisten Benutzer ist es jedoch praktisch unmöglich, eine große Menge von Bildern manuell zu annotieren. Daher müssen Benutzer häufig aus den auto-annotierten Fotos auswählen und die Qualität der Annotationen verbessern.

Ein weiteres Problem des aktuellen Prozesses bestand darin, dass die Daten und ihre Annotationen nicht nahtlos von einer Plattform auf eine andere übertragen werden konnten. Benutzer der Testin-KI-Datenplattform haben derzeit nicht die Möglichkeit, alle ihre Annotationen auf einem Cloud-Laufwerk ihrer Wahl zu speichern, auf das sie zugreifen können. Sie müssen die Annotationen auf ihre lokalen Laufwerke herunterladen, bevor sie Ähnlichkeitssuchen durchführen oder ihre KI-Modelle trainieren können.

Boost Your AI App Efficiency now
Sign up for free to benefit from 150+ QPS with 5,000,000 vectors
Free Trial
Explore our product

# Nutzung der Vektorsuchfunktionen von MyScale auf der Testin-KI-Datenplattform

Daher schlug MyScale vor, dass Testin zwei Änderungen an ihrer KI-Datenplattform in Betracht zieht:

  1. Nutzung der unüberwachten Lernfunktion von MyScale für kleine Stichproben

  2. Testin-Benutzer können gemeinsame Abfragen auf der MyScale-Plattform sowohl von lokalen als auch von Cloud-Geräten ausführen.

Für ersteres ermöglicht MyScale Benutzern die Auswahl bestimmter Bilder aus den Bildchargen mit oder ohne Annotationen, um festzustellen, ob sie zusätzliche Arbeit an ihren Annotationen erfordern. Dies bedeutet, dass ein Benutzer, der die Auto-Annotationsfunktion von Testin verwendet, MyScale verwenden kann, um schnell durch die Chargen von Annotationen zu suchen und zu identifizieren, welche Bilder gute/schlechte (oder keine) Annotationen haben, anstatt manuell nach Bildern zu suchen und zu bestimmen, ob die Bildchargen gute Übereinstimmungen mit einem qualitativ hochwertigen Beispielbild mit Annotationen aufweisen. Dies ist auch nützlich, wenn ein Repository von Fotos annotiert wird, das ständig mit neuen Bildern und Daten aktualisiert wird, da die Verwendung von MyScale es Benutzern ermöglicht, die Bilder nicht durchsuchen zu müssen, um festzustellen, ob Annotationen erforderlich sind.

Für letzteres können Benutzer die SQL-Abfragefunktion der MyScale-Plattform verwenden, um Vektorähnlichkeitssuchen sowohl von ihren verknüpften Cloud-Datenbankkonten als auch von den von ihnen lokal bereitgestellten Vektordateien durchzuführen, um sie mit einem Abfragevektor abzugleichen. Wenn die Abfrage beispielsweise ein Foto oder Text ist, sucht MyScale nach ähnlichem Text und ähnlichen Fotos sowie ähnlichen Videos und anderen Datenmodalitäten. Darüber hinaus hat Testin diese Funktion genutzt, um doppelte Daten herauszufiltern, wenn zwei Vektoren mit hoher Ähnlichkeit entdeckt wurden.

Join Our Newsletter

# Wie MyScale Ihnen helfen kann, neuen Geschäftswert mit Vektorsuche zu erschließen

MyScale hat mit dem Software-Testunternehmen Testin zusammengearbeitet, um ihren Datenannotationsworkflow zu verbessern. Testin nutzte die SQL- und leistungsstarken Vektorsuchfunktionen von MyScale, um ihre eigenen automatischen Datenannotations- und Datenentdoppelungsfunktionen zu entwickeln. Während die manuelle Annotation von Daten üblich ist, stellt sie auch einen Engpass bei der Sicherstellung hochwertiger Datenannotationen sowie bei Zeit- und Kosteneffizienz dar. MyScale unterstützte Testin bei der Entwicklung automatischer Datenannotations- und Datenentdoppelungsfunktionen unter Verwendung der SQL-Funktionen von MyScale.

Als leistungsstarke Datenbank, die sich für die Entwicklung von maschinellen Lernmodellen und Anwendungen eignet, verbesserte Testin seinen Datenannotationsworkflow durch Automatisierung von Prozessen und Reduzierung von Annotationszeit, Speicherplatz und Kosten.

Wenn Ihr Unternehmen auch mit Cloud-Speichern in Ihrer aktuellen Anwendung arbeitet und mehr darüber erfahren möchte, wie MyScale Ihnen helfen kann, mehr Wert aus Ihren Anwendungen und Ihrem Unternehmen zu extrahieren, zögern Sie bitte nicht, uns unter contact@myscale.com zu kontaktieren.

Keep Reading
images
End-to-End RAG-Pipeline-Entwicklung mit MyScale und LlamaIndex

LlamaIndex ist ein Datenframework, das für die Implementierung von Anwendungen mit Large Language Models (LLMs) entwickelt wurde. Es vereinfacht das Parsen, Speichern und Abrufen verschiedener Arten von Dokumentendaten und fügt den Fähigkeiten von LLM-Anwendungen einen immensen Mehrwert hinzu ...

Start building your Al projects with MyScale today

Free Trial
Contact Us