MLflow sluit zich aan bij Linux Foundation

30 juni 2020

De Linux Foun­da­tion, een non profit-orga­ni­satie die innovatie via open source mogelijk maakt, kondigt aan dat MLflow, een open source machine learning-platform van Data­bricks, toetreedt tot de Linux Foun­da­tion. MLflow werd twee jaar geleden gelan­ceerd op de Spark+AI Summit en heeft sindsdien een indruk­wek­kende groei door­ge­maakt. Inmiddels wordt MLflow maan­de­lijks meer dan 2 miljoen keer gedown­load en maken meer dan 200 actieve deel­ne­mers deel uit van de community rond het project. Door aan te sluiten bij de Linux Foun­da­tion krijgt MLflow een onaf­han­ke­lijk ‘thuis’ om verdere adoptie van en bijdragen aan het MLflow project mogelijk te maken.

“De aanhou­dende interesse vanuit de community laat goed zien dat datateams toegewijd zijn om samen te werken aan het machine learning platform van de toekomst. De adop­tie­graad toont daarnaast aan dat er behoefte is aan een open source aanpak om de standaard voor de machine learning lifecycle vast te stellen,” zegt Michael Dolan, VP of Strategic Programs bij de Linux Foun­da­tion. “Van onze samen­wer­king met de grootste open source projecten ter wereld hebben we geleerd dat een open gover­nance model ervoor zorgt dat programma’s sneller innoveren en een hogere adop­tie­graad hebben omdat bijdragen sector­breed mogelijk worden gemaakt.”

Data­bricks heeft MLflow opgezet om een oplossing te bieden voor het inge­wik­kelde proces rondom de ontwik­ke­ling van machine learning modellen. Het oorspron­ke­lijke proces van het bouwen, trainen, finetunen, uitrollen en beheren van deze modellen leverde weten­schap­pers en ontwik­ke­laars veel hoofd­bre­kens op. In tegen­stel­ling tot tradi­ti­o­nele soft­wa­re­ont­wik­ke­ling, waarbij alleen naar verschil­lende code-versies gekeken wordt, werken machine learning modellen met verschil­lende versies van datasets, model­pa­ra­me­ters en  algo­ritmes. Hierdoor ontstaat een veel groter aantal vari­a­belen dat bijge­houden en beheerd moet worden. Daar komt nog bij dat machine learning erg iteratief is, en afhan­ke­lijk van nauwe samen­wer­king tussen zowel data- als appli­ca­tie­teams. Met MLflow blijft dit proces beheers­baar, omdat de teams beschik­king hebben over één platform om de hele machine learning lifecycle te beheren, van voor­be­rei­ding van de data tot de uitein­de­lijke uitrol. Binnen dat proces kunnen ze op dezelfde plek terecht voor test runs, om modellen te delen en met elkaar samen te werken.

Matei Zahara, bedenker van Apache Spark en MLflow, deelde dit belang­rijke nieuws vandaag tijdens zijn keynote presen­tatie op de Spark+AI Summit. “MLflow is de nieuwe open source standaard voor machine learning plat­formen, dankzij de enorme community van deel­ne­mers die bestaat uit honderden engineers uit meer dan honderd verschil­lende bedrijven. Machine learning hervormt alle grote sectoren en is onmisbaar bij miljarden beslis­singen binnen de retail, finan­ciële sector en gezond­heids­zorg. Door met MLflow aan de Linux Foun­da­tion bij te dragen willen we de machine learning community uitno­digen om de handen ineen te slaan om samen te werken aan een standaard machine learning ontwik­ke­lings­plat­form dat voor iedereen beschik­baar is en de hele lifecycle beslaat.”

Tijdens de Spark+AI Summit delen verschil­lende bedrijven hun ervaring met MLflow, waaronder StarbucksExxon­mobilT‑Mobileen Accenture. Tevens worden er vandaag nieuwe functies bekend­ge­maakt die MLflow en de machine learning lifecycle vereen­vou­digen. Daarbij gaat het onder meer om het auto­ma­tisch loggen van expe­ri­menten en verbeterd model­be­heer in het MLflow modelregister.

De Spark + AI Summit vindt deze week digitaal plaats. Inschrijven kan gratis en geeft toegang tot de verschil­lende keynotes, werk­ses­sies en on-demand forums. Inschrijven kan hier.

Pin It on Pinterest

Share This