Senaste maskininlärningsprojekten att testa 2019



Den här artikeln ger dig en omfattande kunskap om maskininlärningsprojekt i branschen och de genombrott som gjorts inom detta område.

är tydligt ett område som har sett galna framsteg under de senaste åren. Denna trend och framsteg har skapat många jobbmöjligheter i branschen. Behovet av Machine Learning Engineers är mycket efterfrågade och den här ökningen beror på utvecklad teknik och generering av enorma mängder data aka Big Data. Så i den här artikeln kommer jag att diskutera de mest fantastiska maskininlärningsprojekten man definitivt borde känna till och arbeta med, i följande ordning:

Vad är maskininlärning?

Machine Learning är ett koncept som gör det möjligt för maskinen att lära sig av exempel och erfarenheter, och det utan att vara uttryckligen programmerad. Så istället för att du skriver koden, vad du gör är att du matar data till den generiska algoritmen, och algoritmen / maskinen bygger logiken baserat på den givna informationen.





Vem är en ML-ingenjör

Steg för maskininlärning

Varje maskininlärningsalgoritm följer ett vanligt mönster eller steg.



Samla in data: Detta steg innefattar insamling av all relevant information från olika källor

Data Wrangling: Det är processen att rengöra och konvertera ”rådata” till ett format som möjliggör bekväm konsumtion

Analysera data: Data analyseras för att välja och filtrera de data som krävs för att förbereda modellen



Tågalgoritm: Algoritmen tränas i träningsdatasetet, genom vilket algoritmen förstår mönstret och de regler som styr datan

Testmodell: Testdatasetet bestämmer noggrannheten i vår modell.

Spridning: Om modellens hastighet och noggrannhet är acceptabel bör den modellen distribueras i det verkliga systemet. Efter att modellen har distribuerats baserat på dess prestanda uppdateras och förbättras modellen om prestanda sjunker igenom.

Typer av maskininlärning

Maskininlärning är underkategoriserad i tre typer:

Övervakat lärande: Det är den där du har inputvariabler (x) och en outputvariabel (Y) och du använder en algoritm för att lära dig kartläggningsfunktionen från ingången till utgången.

Oövervakad inlärning: Ibland är den givna informationen ostrukturerad och omärkt. Så det blir svårt att klassificera den informationen i olika kategorier. Oövervakat lärande hjälper till att lösa detta problem. Denna inlärning används för att gruppera indata i klasser baserat på deras statistiska egenskaper.

Förstärkning lärande: Det handlar om att vidta lämpliga åtgärder för att maximera belöningen i en viss situation.
när det gäller förstärkning lärande, det finns ingen förväntad produktion. Förstärkningsagenten bestämmer vilka åtgärder som ska vidtas för att utföra en viss uppgift. I avsaknad av ett träningsdataset är det bundet att lära av sin erfarenhet.

Låt oss nu titta på några verkliga maskininlärningsprojekt som kan hjälpa företag att generera vinst.

Användningsfall för branschen

1. RÖRELSESTUDIO

Domän: Halv

Fokus: Optimera urvalsprocessen

analysera xml-filen i java

Affärsutmaning: Motion Studio är det största radioproduktionshuset i Europa. Med en omsättning på mer än en miljard dollar har företaget beslutat att lansera en ny realityshow: RJ Star. Svaret på showen är utan motstycke och företaget översvämmas av röstklipp. Du som ML-expert måste klassificera rösten som antingen man / kvinna så att den första filtreringsnivån blir snabbare.

Nyckelfrågor: Röstprov är över accenter.

Affärsnytta: Eftersom RJ Star är en realityshow är tiden för att välja kandidater mycket kort. Hela showens framgång och därmed vinsten beror på ett snabbt och smidigt genomförande

importera pandor som pd importera numpy som np importera matplotlib.pyplot som plt importera seaborn som sns% matplotlib inline importvarningar varningar. filtervarningar ('ignorera') df = pd.read_csv ('röst-klassificering.csv') df.head ()

# Kontrollera nej. av poster df.info () df.beskriv () df.isnull (). sum ()

print ('Shape of Data:', df.shape) print ('Totalt antal etiketter: {}'. format (df.shape [0])) print ('Number of male: {}'. format (df [ df.label == 'hane']. form [0])) tryck ('Antal hona: {}'. format (df [df.label == 'hona']. form [0]))

X = df.iloc [:,: -1] print (df.shape) print (X.shape)

från sklearn.preprocessing importerar LabelEncoder y = df.iloc [:, - 1] gender_encoder = LabelEncoder () y = gender_encoder.fit_transform (y) y från sklearn.preprocessing import StandardScaler scaler = StandardScaler () scaler.fit (X) X = scaler.transform (X) från sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100) from sklearn.svm import SVC from sklearn import metrics from sklearn.met , confusion_matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) print ('Accuracy Score:') print (metrics.accuracy_score (y_test, y_pred))

skriv ut (confusion_matrix (y_test, y_pred))

2. LITIONKRAFT

Domän: Bil

Fokus: Incitera drivrutiner

Affärsutmaning: Lithionpower är den största leverantören av elbatterier (e-fordon). Förare hyr batteri vanligtvis en dag och byter sedan ut det mot ett laddat batteri från företaget. Lithionpower har en variabel prissättningsmodell baserad på förarens körhistorik. Eftersom batteriets livslängd beror på faktorer som överhastighet, körd sträcka per dag etc. Du som ML-expert måste skapa en klustermodell där förare kan grupperas tillsammans baserat på kördata.

Nyckelfrågor: Drivrutiner kommer att stimuleras baserat på klustret, så grupperingen måste vara korrekt.

Affärsfördelar: Ökad vinst, upp till 15-20% eftersom förare med dålig historia kommer att debiteras mer.

importera pandor som pd importera numpy som np importera matplotlib.pyplot som plt importera seaborn som sns sns.set () # för plotstyling% matplotlib inline importvarningar varningar. filtervarningar ('ignorera') importera matplotlib.pyplot som plt plt.rcParams [ 'figure.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()

df.info () df.beskriv ()

från sklearn.cluster import KMeans #Taking 2 clusters kmeans = KMeans (n_clusters = 2) df_analyze = df.drop ('id', axis = 1) kmeans.fit (df_analyze)

kmeans.cluster_centers_

skriva ut (kmeans.labels_) skriva ut (len (kmeans.labels_))

skriva ut (typ (kmeans.labels_)) unikt, räknar = np.unique (kmeans.labels_, return_counts = True) print (dict (zip (unikt, räknar)))

df_analyze ['cluster'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, aspekt = 1, fit_reg = Falsk)

# Nu, låt oss kontrollera klusterna, när n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id', axis = 1)) tryck (kmeans_4.cluster_centers_) unikt, räknar = np.unique (kmeans_4.labels_, return_counts = True) kmeans_4.cluster_centers_ print (dict (zip (unikt, räknas)))

df_analyze ['cluster'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6 aspekt = 1, fit_reg = Falsk)

3. BluEx

Domän: Logistik

Fokus: Optimal väg

Affärsutmaning: BluEx är ett ledande logistikföretag i Indien. Det är känt för effektiv leverans av paket till kunder. BluEx står dock inför en utmaning där dess bilförare tar en suboptimal väg för leverans. Detta orsakar förseningar och högre bränslekostnader. Du som ML-expert måste skapa en ML-modell med hjälp av förstärkningslärande så att en effektiv väg kan hittas genom programmet.

Nyckelfrågor: Data har många attribut och klassificering kan vara svårt.

Affärsfördelar: Upp till 15% av bränslekostnaden kan sparas genom att ta den bästa vägen.

importera numpy som np import pylab som plt importera nätverkx som nx #Initializing points points_list = [(0,1), (1,5), (5,6), (5,4), (1,2), (2 , 3), (2,7)] goal = 7 mapping = {0: 'Start', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-Destination '} G = nx.Graph () G.add_edges_from (points_list) pos = nx.spring_layout (G, k = .5, center = points_list [2]) nx .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()

NO_OF_POINTS = 8 #Inititlaizing R Matrix R = np.matrix (np.ones (form = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 för punkt i poänglista: skriv ut (punkt) om punkt [1] == mål: R [point] = 150 else: R [point] = 0 if point [0] == goal: R [point [:: - 1]] = 150 else: # reverse of point R [point [:: - 1]] = 0

R [mål, mål] = 150 R

Q = np.matrix (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # Inlärningsparametern gamma = 0,8 initial_stat = 1 def tillgängligt_åtgärder (tillstånd): current_state_row = R [state,] av_act = np.where (current_state_row & ampampampgt = 0 ) [1] returnera av_akt tillgänglig_akt = tillgänglig_handling (initialstat) def sample_next_action (available_actions_range): next_action = int (np.random.choice (available_act, 1)) return next_action action = sample_next_action (available_act) def update (current_state, action, gamma) : max_index = np.where (Q [action,] == np.max (Q [action,])) [1] if max_index.shape [0] & ampampampgt 1: max_index = int (np.random.choice (max_index, storlek = 1)) annat: max_index = int (max_index) max_value = Q [action, max_index] Q [current_state, action] = R [current_state, action] + gamma * max_value print ('max_value', R [current_state, action] + gamma * max_value) if (np.max (Q) & ampampampgt 0): return (np.sum (Q / np.max (Q) * 100)) else: return (0) update (initial_state, action, gamma)

poäng = [] för i inom intervallet (700): nuvarande_stat = np.random.randint (0, int (Q.shape [0])) tillgängligt_akt = tillgängligt_åtgärder (nuvarande_stat) åtgärd = exempel_next_action (tillgängligt_akt) poäng = uppdatering (aktuell_stat, action, gamma) scores.append (score) print ('Score:', str (score)) print ('Trained Q matrix:') print (Q / np.max (Q) * 100) # Testing current_state = 0 steg = [current_state] medan current_state! = 7: next_step_index = np.where (Q [current_state,] == np.max (Q [current_state,])) [1] if next_step_index.shape [0] & ampampampgt 1: next_step_index = int (np.random.choice (nästa_steg_index, storlek = 1)) annat: nästa_steg_index = int (nästa_steg_index) steg. lägg till (nästa_steg_index) nuvarande_stat = nästa_steg_index

skriv ut ('Mest effektiva sökväg:') skriva ut (steg) plt.plot (poäng) plt.show ()

Open Source Machine Learning-projekt 2019

Detektron : Detectron är Facebook AI Researchs mjukvarusystem som implementerar toppmoderna objektdetekteringsalgoritmer. Den är skriven i Python och drivs av Caffe2 deep learning framework.

Målet med Detectron är att tillhandahålla en högkvalitativ, högpresterande kodbas för objektdetekteringsforskning. Den är utformad för att vara flexibel för att stödja snabb implementering och utvärdering av ny forskning. Den innehåller mer än 50 förutbildade modeller.

Densposera : Uppskattning av tät mänsklig pose syftar till att kartlägga alla mänskliga pixlar av en RGB-bild till människokroppens 3D-yta. DensePose-RCNN implementeras i Detectron-ramverket.

passerar genom referens i java

TensorFlow.js : Det är ett bibliotek för utveckling och utbildning av ML-modeller och distribution i webbläsaren. Det har blivit en mycket populär release eftersom det släpptes tidigare i år och fortsätter att förvåna sig med sin flexibilitet. Med detta kan du

  • Utveckla ML i webbläsaren: Använd flexibla och intuitiva API: er för att bygga modeller från grunden med hjälp av JavaScript-linjärt algebra-bibliotek på låg nivå eller API för högnivålager.
  • Kör befintliga modeller : Använd TensorFlow.js-modellomvandlare för att köra befintliga TensorFlow-modeller direkt i webbläsaren.
  • Omskolning Befintliga modeller: Omskola befintliga ML-modeller med sensordata som är anslutna till webbläsaren eller annan data på klientsidan.

Waveglow: Maskininlärning gör också stora framsteg inom ljudbehandling och det genererar inte bara musik eller klassificering. WaveGlow är ett flödesbaserat generativt nätverk för talsyntes av NVIDIA. Forskarna har också listat ned stegen du kan följa om du vill träna din egen modell från grunden.

Bildmålning : Föreställ dig att du har en halvbild av en scen och att du ville ha hela landskapet, ja det är vad bildmålning kan göra för dig. Detta projekt är en Keras-implementering av Stanfords Image Outpainting-papper. Modellen utbildades med 3500 skrotade stranddata med argumentation totalt upp till 10.500 bilder för 25 epoker .

Detta är ett fantastiskt papper med en detaljerad förklaring steg för steg. Ett måste exempel för alla maskininlärningsentusiaster. Personligen är detta mitt favorit Machine Learning-projekt.

Deep Painterly Harmonization : Tja, prata om bilder, den här är ett mästerverk. Vad denna algoritm gör är att ta en bild som inmatning och om du lägger till ett externt element i bilden, blandar det elementet i omgivningen som om det är en del av den.

Kan du se skillnaden? Ingen rätt? Det här visar oss hur långt vi har kommit när det gäller maskininlärning.

DeepMimic: Titta nu noga på bilderna här, du ser en stickfigur som gör spin-kick, backflip och cartwheel. Att min vän förstärker lärande i aktion. DeepMimic är ett exempel på guidad djupförstärkning av fysikbaserade karaktärsfärdigheter.

Magenta : Magenta är ett forskningsprojekt som utforskar maskininlärningens roll i processen att skapa konst och musik. Det handlar främst om att utveckla nya algoritmer för inlärning av djupinlärning och förstärkning för att skapa sånger, bilder, teckningar och annat material.

Det är också en utforskning av att bygga smarta verktyg och gränssnitt som gör det möjligt för artister och musiker att utvidga ( inte ersätta! ) deras processer med hjälp av dessa modeller. Gå sprida dina vingar, skapa ditt unika innehåll för Instagram eller Soundcloud och bli en influencer.

Så killar, med detta kommer vi till ett slut på denna fantastiska artikel om maskininlärningsprojekt. Prova dessa exempel och låt oss veta i kommentarfältet nedan. Jag hoppas att du fick lära känna det praktiska genomförandet av maskininlärning i branschen. Edureka's gör dig skicklig i tekniker som Supervised Learning, Oövervakat lärande och Natural Language Processing. Det inkluderar utbildning om de senaste framstegen och tekniska tillvägagångssätten inom artificiell intelligens och maskininlärning som djupinlärning, grafiska modeller och förstärkningslärande