Snorkel AI obtient 35 millions de dollars de collection B pour automatiser l’étiquetage des informations dans la recherche d’appareils – TechCrunch

Une personne des autres éléments laborieux de la compréhension de la machine fournit un ensemble d’étiquettes pour former le modèle de compréhension de l’appareil ce qu’il doit savoir. Snorkel AI aimerait permettre aux autorités compétentes en la matière d’utiliser beaucoup plus facilement les étiquettes des personnes par programmation, et aujourd’hui, la startup a annoncé une séquence B de 35 millions de dollars.

Il a également introduit un nouveau dispositif appelé Programs Studio qui offre un moyen de créer des applications fréquentes de recherche de machines en appliquant des modèles et des pièces prédéfinies.

Lightspeed Venture Partners a dirigé le marché avec la participation des investisseurs précédents Greylock, GV, In-Q-Tel et Nepenthe Cash. Les nouveaux acheteurs Walden et BlackRock se sont également joints à nous. La startup constate qu’elle a maintenant levé 50 millions de dollars.

Le cofondateur et PDG de la société, Alex Ratner, déclare que l’étiquetage des données reste un défi important et un obstacle à l’évolution de la compréhension des machines et de l’intelligence artificielle dans un grand nombre d’industries, car il est coûteux, à forte intensité de main-d’œuvre et difficile pour les professionnels en la matière. prenez le temps de le faire.

« Le mystère pas si caché à propos de l’IA de nos jours est que malgré toutes les améliorations technologiques et d’outillage, environ 80 à 90 % du prix et du temps d’une entreprise d’IA ordinaire sont consacrés à l’étiquetage manuel, à l’accumulation et au réétiquetage de ces connaissances scolaires. » rapporta-t-il.

Il dit que son entreprise a conçu une résolution pour simplifier ce plan d’action afin qu’il soit moins compliqué pour les gourous du sujet d’incorporer les étiquettes par programmation, une méthode qui, selon lui, réduit le temps et les efforts et le travail acharné nécessaires pour utiliser les étiquettes de manière très spectaculaire. de mois à heures ou jours, selon la complexité des connaissances.

Au fur et à mesure que l’entreprise a élaboré cette méthode, les acheteurs se sont demandé si l’étape future de la machine découvrait le plan d’action, c’est-à-dire les détails de l’enseignement, la conception et la configuration d’un logiciel. C’est là qu’intervient le Software Studio. Il peut s’agir d’un classificateur d’accords dans une institution financière ou d’un détecteur d’anomalies de réseau dans une entreprise de télécommunications et cela aidera les fournisseurs à franchir cette étape future après l’étiquetage des détails.

“Il ne s’agit pas seulement de la façon dont vous étiquetez les données par programmation, mais aussi des versions, des préprocesseurs, des processeurs d’articles, et nous avons donc rendu cela désormais accessible dans un type d’interface sans code modélisée et visible”, a-t-il déclaré.

Les produits de l’entreprise sont principalement basés sur une étude qui a commencé au Stanford AI Lab en 2015. Les fondateurs ont utilisé 4 ans dans la section d’analyse avant de lancer Snorkel en 2019. Aujourd’hui, la startup compte 40 employés. Ratner reconnaît les difficultés rencontrées par l’entreprise de savoir-faire technologique du point de vue de la diversité et affirme avoir conçu un travail attentif pour développer une entreprise variée et inclusive.

“Ce que je peux dire, c’est que nous avons expérimenté pour le prioriser au niveau de l’entreprise, de l’ensemble du groupe et au niveau du conseil d’administration dès le premier jour, et également pour définir le mouvement qui le dirige. Nous avons donc travaillé avec des sociétés externes pour la formation interne et les audits et techniques proches de DEI, et nous avons construit une diversité de pipelines, un besoin non négociable de nos contrats avec les sociétés de recrutement », a-t-il déclaré.

Ratner reconnaît également que l’automatisation peut compliquer les biais de code dans les types d’apprentissage d’équipement, et il espère qu’en simplifiant l’approche d’étiquetage, il sera beaucoup moins compliqué de détecter les biais lorsqu’ils se produisent.

« Si vous commencez avec une douzaine ou deux douzaines de ce que nous appelons des fonctions d’étiquetage dans Snorkel, vous devez continuer à être vigilant et proactif pour espérer détecter les biais, mais il est beaucoup plus facile d’auditer ce qui a appris à votre modèle pour le transformer. en revenant simplement et en recherchant quelques centaines de traces de code. »