Databricks vereenvoudigt beheer van Machine Learning modellen met MLflow Model Registry

24 oktober 2019

Data­bricks heeft de beschik­baar­heid van Model Registry aange­kon­digd, een nieuwe moge­lijk­heid binnen MLflow. MLflow is een open source platform voor de machine learning lifecycle en is ontworpen door Databricks.

Dit nieuwe component maakt een volle­diger model­be­heer­proces mogelijk door data­we­ten­schap­pers en engineers te voorzien van één centrale plek om samen te werken aan machine learning-modellen en deze te volgen en delen gedurende het hele proces van expe­ri­ment tot productie. Sinds de intro­ductie van MLflow op de Spark+AI Summit in 2018, hebben meer dan 140 mensen bijdragen geleverd en wordt het maan­de­lijks meer dan 800.000 keer gedownload.

“Iedereen die zich bezig­houdt met de ontwik­ke­ling van machine learning weet dat dit een complex proces is. De moge­lijk­heid om modellen te beheren en delen is onmisbaar om verwar­ring te voorkomen, omdat het aantal modellen in de experimentele‑, test- en produc­tie­fase op kan lopen tot in de duizenden,” aldus Matei Zaharia, mede­op­richter en CTO bij Data­bricks. “De nieuwste toevoe­gingen aan MLflow, ontwik­keld in samen­spraak met honderden bijdra­gers, stellen orga­ni­sa­ties wereld­wijd in staat om problemen met machine learning ontwik­ke­ling aan te pakken. MLflow wordt honderd­dui­zenden keren per maand gedown­load, dus we zien dat de bijdragen van de community een positieve impact hebben.”

MLflow van Data­bricks kan al ontzet­tend veel. Zo kunnen gebrui­kers metrische waarden, para­me­ters en artifacts van expe­ri­menten loggen, en modellen en machine learning projecten packagen. Bovendien kunnen modellen flexibel ingezet worden binnen het platform of op iedere wille­keu­rige cloud inference service of container. De MLflow Model Registry bouwt verder op deze moge­lijk­heden, door bedrijven in staat te stellen samen te werken aan modellen en deze te opti­ma­li­seren in de hele ontwik­ke­lings­le­vens­cy­clus van de machine learning modellen, door middel van:

  • Een samen­wer­kingshub: MLflow Model Registry voorziet in de moge­lijk­heid om binnen ontwik­kel­teams kennis en expertise te delen over de bouw en uitrol van machine learning-modellen. Dit gebeurt door de modellen makkelijk vindbaar te maken, en door samen­wer­kings­mo­ge­lijk­heden te bieden voor het geza­men­lijk verbe­teren van gemeen­schap­pe­lijke machine learning-taken.
  • Flexibele CI/​CD pipelines: MLflow Model Registry behouden teams de controle over hun machine learning-modellen door modellen auto­ma­tisch door te zetten naar productie wanneer ze aan bepaalde voor­waarden voldoen. Ook kunnen stappen binnen de lifecycle handmatig gecon­tro­leerd en geva­li­deerd worden voor modellen in de expe­ri­men­tele, test- en productiefase.
  • Zicht­baar­heid en beheer: Grote orga­ni­sa­ties hebben op ieder wille­keurig moment vaak duizenden machine learning-modellen in de expe­ri­men­tele, test- en produc­tie­fase. Met MLflow Model Registry krijgen ze daar volledig inzicht in en wordt beheer van ieder model mogelijk dankzij een model­be­wer­kings­ge­schie­denis en door toe te wijzen wie het model mag bewerken.

Model Registry is beschik­baar op Data­bricks en heeft dezelfde voordelen als het Unified Data Analytics Platform, waaronder security op enter­prise-niveau, schaal­baar­heid en fijnmazig toegangs­be­heer. De Model Registry-component maakt onderdeel uit van het open source aanbod van MLflow en is ook beschik­baar voor de open source community op GitHub.

 

Pin It on Pinterest

Share This