- Artikel
- 13Minuten Lesedauer
Erfahren Sie, wie Sie ein Klassifizierungsmodell mit AutoML ohne Schreiben von Code trainieren, indem Sie in Azure Machine Learning Studio automatisierte maschinelles Lernen verwenden. Dieses Klassifizierungsmodell sagt vorher, ob ein Kunde Festgeld bei einer Bank anlegt.
Sie können zeitintensive Aufgaben mit dem Azure Machine Learning automatisieren. Beim automatisierten maschinellen Lernen werden viele Kombinationen von Algorithmen und Hyperparametern schnell durchlaufen, um basierend auf einer von Ihnen ausgewählten Erfolgsmetrik das beste Modell zu ermitteln.
In diesem Tutorial schreiben Sie keinen Code. Sie verwenden die Studio-Benutzeroberfläche für das Trainieren. Dabei lernen Sie Folgendes:
- Erstellen Sie einen Azure Machine Learning-Arbeitsbereich.
- Ausführen eines automatisierten Machine Learning-Experiments
- Untersuchen Sie die Modelldetails.
- Stellen Sie das empfohlene Model bereit.
Probieren Sie auch automatisiertes maschinelles Lernen für diese anderen Modelltypen aus:
- Ein Beispiel für Vorhersagen ohne Codieren finden Sie unter Tutorial: Nachfragevorhersage und AutoML.
- Ein erstes Codebeispiel eines Objekterkennungsmodells finden Sie im Tutorial: Trainieren eines Objekterkennungsmodells mit automatisierter ML und Python.
Voraussetzungen
Ein Azure-Abonnement. Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen.
Laden Sie die Datendatei bankmarketing_train.csv herunter. In der Spalte y ist angegeben, ob ein Kunde Festgeld angelegt hat. Sie wird später als Zielspalte für Vorhersagen in diesem Tutorial festgelegt.
Erstellen eines Arbeitsbereichs
Ein Azure Machine Learning-Arbeitsbereich ist eine grundlegende Cloudressource zum Experimentieren, Trainieren und Bereitstellen von MachineLearning-Modellen. Er verknüpft Ihr Azure-Abonnement und Ihre Ressourcengruppe mit einem einfach nutzbaren Objekt im Dienst.
Es gibt viele Möglichkeiten, einen Arbeitsbereich zu erstellen. In diesem Tutorial erstellen Sie einen Arbeitsbereich über das Azure-Portal, einer webbasierten Konsole zum Verwalten Ihrer Azure-Ressourcen.
Melden Sie sich mit den Anmeldeinformationen für Ihr Azure-Abonnement beim Azure-Portal an.
Wählen Sie im Azure-Portal oben links die drei Balken und dann + Ressource erstellen aus.
Suchen Sie mithilfe der Suchleiste Azure Machine Learning.
Wählen Sie Azure Machine Learning aus.
Wählen Sie im Bereich Machine Learning die Option Erstellen aus, um zu beginnen.
Geben Sie die folgenden Informationen an, um den neuen Arbeitsbereich zu konfigurieren:
Feld BESCHREIBUNG Arbeitsbereichname Geben Sie einen eindeutigen Namen ein, der Ihren Arbeitsbereich identifiziert. In diesem Beispiel verwenden wir docs-ws. Namen müssen in der Ressourcengruppe eindeutig sein. Verwenden Sie einen Namen, der leicht zu merken ist und sich von den von anderen Benutzern erstellten Arbeitsbereichen unterscheidet. Subscription Wählen Sie das gewünschte Azure-Abonnement aus. Resource group Verwenden Sie eine vorhandene Ressourcengruppe in Ihrem Abonnement, oder geben Sie einen Namen ein, um eine neue Ressourcengruppe zu erstellen. Eine Ressourcengruppe enthält verwandte Ressourcen für eine Azure-Lösung. In diesem Beispiel verwenden wir docs-aml. Region Wählen Sie den Standort aus, der Ihren Benutzern und den Datenressourcen am nächsten ist, um Ihren Arbeitsbereich zu erstellen. Speicherkonto Ein Speicherkonto wird als Standarddatenspeicher für den Arbeitsbereich verwendet. Sie können eine neue Azure Storage-Ressource erstellen oder eine in Ihrem Abonnement vorhandene Ressource auswählen. Schlüsseltresor Ein Schlüsseltresor wird zum Speichern von Geheimnissen und anderen vertraulichen Informationen verwendet, die vom Arbeitsbereich benötigt werden. Sie können eine neue Azure Key Vault-Ressource erstellen oder eine in Ihrem Abonnement vorhandene Ressource auswählen. Application Insights Der Arbeitsbereich verwendet Azure Application Insights, um Überwachungsinformationen zu Ihren bereitgestellten Modellen zu speichern. Sie können eine neue Azure Application Insights-Ressource erstellen oder eine in Ihrem Abonnement vorhandene Ressource auswählen. Containerregistrierung Eine Containerregistrierung wird verwendet, um Docker-Images zu registrieren, die zu Trainingszwecken und in Bereitstellungen verwendet werden. Sie können eine Ressource erstellen oder eine in Ihrem Abonnement vorhandene Ressource auswählen. Wenn die Konfiguration des Arbeitsbereichs abgeschlossen ist, wählen Sie Überprüfen+ erstellen aus.
Klicken Sie auf Erstellen, um den Arbeitsbereich zu erstellen.
Warnung
Die Erstellung des Arbeitsbereichs in der Cloud kann einige Minuten dauern.
Wenn der Vorgang abgeschlossen ist, wird eine Erfolgsmeldung zur Bereitstellung angezeigt.
Um den neuen Arbeitsbereich anzuzeigen, wählen Sie Zu Ressource wechseln aus.
Wählen Sie in der Portalansicht Ihres Arbeitsbereichs Studio starten aus, um zum Azure Machine Learning Studio zu wechseln.
Wichtig
Notieren Sie sich Ihren Arbeitsbereich und Ihr Abonnement. Sie benötigen diese Informationen, um sicherzustellen, dass Sie Ihr Experiment an der richtigen Stelle erstellen.
Anmelden bei Studio
Sie schließen die folgende Experimenteinrichtung ab und führen Schritte über Azure Machine Learning Studio unter https://ml.azure.com aus. Hierbei handelt es sich um eine konsolidierte Weboberfläche mit Tools für maschinelles Lernen zur Durchführung von DataScience-Szenarien für Datenwissenschaftler jeglicher Qualifikation. Das Azure Machine Learning-Studio wird in InternetExplorer-Browsern nicht unterstützt.
Melden Sie sich bei Azure Machine Learning Studio an.
Wählen Sie Ihr Abonnement und den erstellten Arbeitsbereich aus.
Wählen Sie Erste Schritte aus.
Wählen Sie im linken Bereich im Abschnitt Ersteller die Option Automatisiertes maschinelles Lernen aus.
Wenn Sie zum ersten Mal ein Experiment für automatisiertes ML ausführen, werden eine leere Liste und Links zur Dokumentation angezeigt.
Wählen Sie +Neuer automatisierter ML-Auftrag aus.
Erstellen und Laden des Datasets
Laden Sie vor dem Konfigurieren Ihres Experiments Ihre Datendatei in Form eines AzureMachineLearning-Datasets in Ihren Arbeitsbereich hoch. Dadurch wird die ordnungsgemäße Formatierung der Daten für Ihr Experiment sichergestellt.
Erstellen Sie ein neues Dataset, indem Sie im Dropdown + Dataset erstellen die Option Aus lokalen Dateien auswählen.
Geben Sie Ihrem Dataset im Formular Grundlegende Informationen einen Namen, und geben Sie optional eine Beschreibung an. Die Oberfläche für automatisiertes maschinelles Lernen unterstützt derzeit nur TabularDatasets. Der Datasettyp muss daher standardmäßig auf Tabellarisch festgelegt sein.
Wählen Sie links unten die Option Weiter aus.
Wählen Sie im Formular Datenspeicher- und Dateiauswahl den Standarddatenspeicher aus, der im Zuge der Erstellung Ihres Arbeitsbereichs automatisch eingerichtet wurde: workspaceblobstore (Azure Blob Storage) . Hier laden Sie Ihre Datendatei hoch, um sie für Ihren Arbeitsbereich verfügbar zu machen.
Wählen Sie im Upload-Dropdownmenü den Eintrag Dateien hochladen aus.
Wählen Sie auf dem lokalen Computer die Datei bankmarketing_train.csv aus. Dies ist die Datei, die Sie als Voraussetzung heruntergeladen haben.
Wählen Sie unten links Weiter aus, um das Dataset in den Standardcontainer hochzuladen, der bei der Erstellung Ihres Arbeitsbereichs automatisch eingerichtet wurde.
Sobald das Hochladen abgeschlossen ist, wird das Formular Einstellungen und Vorschau basierend auf dem Dateityp vorab aufgefüllt.
Überprüfen Sie, ob das Formular Einstellungen und Vorschau wie folgt ausgefüllt ist, und klicken Sie auf Weiter.
Feld BESCHREIBUNG Wert für das Tutorial Dateiformat Definiert das Layout und den Typ der in einer Datei gespeicherten Daten. Durch Trennzeichen getrennt Trennzeichen Mindestens ein Zeichen zum Angeben der Grenze zwischen separaten, unabhängigen Regionen in Nur-Text- oder anderen Datenströmen. Komma Codieren Gibt an, welche Bit-zu-Zeichen-Schematabelle verwendet werden soll, um Ihr Dataset zu lesen. UTF-8 Spaltenüberschriften Gibt an, wie die Header des Datasets, sofern vorhanden, behandelt werden. Alle Dateien weisen dieselben Header auf. Zeilen überspringen Gibt an, wie viele Zeilen im Dataset übersprungen werden. Keine Das Formular Schema ermöglicht eine weitere Konfiguration der Daten für dieses Experiment. Wählen Sie für dieses Beispiel den Umschalter für das Feature day_of_week aus, um es nicht einzuschließen. Wählen Sie Weiter aus.
Überprüfen Sie im Formular Details bestätigen die zuvor in die Formulare Grundlegende Infos, Datenspeicher- und Dateiauswahl und Einstellungen und Vorschau eingetragenen Informationen.
Wählen Sie Erstellen aus, um die Erstellung Ihres Datasets abzuschließen.
Wählen Sie Ihr Dataset aus, sobald es in der Liste angezeigt wird.
Überprüfen Sie die Datenvorschau, um sicherzustellen, dass Sie nicht day_of_week einbezogen haben. Klicken Sie dann auf Schließen.
Wählen Sie Weiter aus.
Auftrag konfigurieren
Nach dem Laden und Konfigurieren Ihrer Daten können Sie Ihr Experiment einrichten. Dieses Setup umfasst Experimententwurfsaufgaben, etwa das Auswählen der Größe Ihrer Compute-Umgebung und das Angeben der Spalte, die Sie vorhersagen möchten.
Aktivieren Sie das Optionsfeld Neu erstellen.
Füllen Sie das Formular Auftrag konfigurieren wie folgt aus:
Geben Sie den folgenden Experimentnamen ein:
my-1st-automl-experiment
Wählen Sie y als Zielspalte aus, in der Sie Vorhersagen ausführen möchten. Diese Spalte gibt an, ob der Kunde eine Termineinlage bei der Bank gezeichnet hat.
Wählen Sie Computecluster als Computetyp aus.
Verwenden Sie +Neu zum Konfigurieren Ihres Computeziels. Ein Computeziel ist eine lokale oder cloudbasierte Ressourcenumgebung, in der Ihr Trainingsskript ausgeführt oder Ihre Dienstbereitstellung gehostet wird. Für dieses Experiment verwenden wir eine cloudbasierte Computeumgebung.
Füllen Sie das Formular zum Auswählen der VM aus, um Ihre Compute-Instanz einzurichten.
Feld BESCHREIBUNG Wert für das Tutorial Standort Ihre Region, von der aus Sie die VM ausführen möchten USA, Westen 2 Stufe der VM Wählen Sie aus, welche Priorität ihr Experiment aufweisen soll. Dediziert Typ des virtuellen Computers Wählen Sie den VM-Typ für Ihre Compute-Umgebung aus. CPU (Zentralprozessor) Größe des virtuellen Computers Wählen Sie die Größe für Ihren Computes aus. Eine Liste der empfohlenen Größen wird auf der Grundlage Ihrer Daten und des Experimenttyps bereitgestellt. Standard_DS12_V2 Wählen Sie Weiter aus, um das Formular Einstellungen konfigurieren auszufüllen.
Feld BESCHREIBUNG Wert für das Tutorial Computename Ein eindeutiger Name, der Ihren Computekontext identifiziert. automl-compute Min/Max nodes (Min./Max. Knoten) Um ein Datenprofil zu erstellen, müssen Sie mindestens einen Knoten angeben. Min. Knoten: 1
Max. Knoten: 6Leerlauf in Sekunden vor dem Herunterskalieren Leerlaufzeit vor dem automatischen Herunterskalieren des Clusters auf die minimale Knotenanzahl 120 (Standardwert) Erweiterte Einstellungen Einstellungen zum Konfigurieren und Autorisieren eines virtuellen Netzwerks für Ihr Experiment Keine Wählen Sie Erstellen aus, um Ihr Computeziel zu erstellen.
Dieser Vorgang nimmt einige Minuten in Anspruch.
Wählen Sie nach der Erstellung in der Dropdownliste Ihr neues Computeziel aus.
Wählen Sie Weiter aus.
Vervollständigen Sie die Einrichtung für Ihr automatisiertes Azure Machine Learning-Experiment in dem Formular Aufgaben und Einstellungen auswählen. Geben Sie dazu den Aufgabentyp und die Konfigurationseinstellungen für maschinelles Lernen an.
Wählen Sie als ML-Aufgabentyp Klassifizierung aus.
Klicken Sie auf Zusätzliche Konfigurationseinstellungen anzeigen, und füllen Sie die Felder wie folgt aus. Mit diesen Einstellungen können Sie den Trainingsauftrag besser steuern. Andernfalls werden die Standardwerte auf Basis der Experimentauswahl und -daten angewendet.
Zusätzliche Konfigurationen BESCHREIBUNG Wert für das Tutorial Primary metric (Primäre Metrik) Auswertungsmetrik, die zur Messung des Machine Learning-Algorithmus verwendet wird. AUC_weighted Explain best model (Bestes Modell erläutern) Zeigt automatisch die Erklärbarkeit für das beste Modell an, das durch automatisiertes ML erstellt wurde. Aktivieren Blockierte Algorithmen Algorithmen, die Sie aus den Trainingsauftrag ausschließen möchten. Keine Zusätzliche Klassifizierungseinstellungen Diese Einstellungen tragen dazu bei, die Genauigkeit des Modells zu verbessern. Positive Klassenbezeichnung: keine Beendigungskriterium Wenn ein Kriterium erfüllt ist, wird der Trainingsauftrag angehalten. Trainingsauftragszeit (Stunden): 1
Metrischer Bewertungsschwellenwert: keinerParallelität Die maximale Anzahl paralleler Iterationen pro Iteration Maximale Anzahl gleichzeitiger Iterationen: 5 Wählen Sie Speichern aus.
Wählen Sie Weiter aus.
Wählen Sie im Formular [Optional] Validieren und Testen
- „k-fache Kreuzvalidierung“ als Validierungstyp aus.
- Wählen Sie 2 als Anzahl der Kreuzvalidierungen aus.
Wählen Sie Fertig stellen aus, um das Experiment auszuführen. Wenn die Vorbereitung des Experiments beginnt, wird der Bildschirm Auftragsdetails geöffnet, auf dem am oberen Rand der Auftragsstatus angezeigt wird. Dieser Status wird während des Experimentausführung entsprechend aktualisiert. Außerdem werden in der rechten oberen Ecke des Studios Benachrichtigungen angezeigt, die Sie über den Status Ihres Experiments informieren.
Wichtig
Die Vorbereitung des Experiments nimmt 10–15Minuten in Anspruch.Sobald es ausgeführt wird, dauert jede Iteration mindestens zwei bis drei Minuten.
In einer Produktionsumgebung würden Sie in dieser Zeit wahrscheinlich eine kurze Pause machen. Für dieses Tutorial empfehlen wir jedoch, schon während der Ausführung der weiteren Iterationen mit der Untersuchung der getesteten Algorithmen auf der Registerkarte Modelle zu beginnen.
Untersuchen von Modellen
Navigieren Sie zur Registerkarte Modelle, um die getesteten Algorithmen (Modelle) anzuzeigen. Standardmäßig werden die Modelle nach ihrem Abschluss nach der Metrikbewertung sortiert. In diesem Tutorial steht das Modell, das für die ausgewählte AUC_weighted-Metrik die höchste Bewertung erhält, ganz oben in der Liste.
Während Sie auf den Abschluss aller Experimentmodelle warten, können Sie den Algorithmusnamen eines abgeschlossenen Modells auswählen und sich die zugehörigen Leistungsdetails ansehen.
Nachfolgend werden die Registerkarten Details und Metriken durchlaufen, um die Eigenschaften, Metriken und Leistungsdiagramme des ausgewählten Modells anzuzeigen.
Modellerklärungen
Während Sie darauf warten, dass die Modelle abgeschlossen werden, können Sie anhand der Modellerklärungen ermitteln, welche Datenfeatures (Rohdaten oder verarbeitete Daten) die Vorhersagen eines bestimmten Modells beeinflusst haben.
Diese Modellerklärungen können bei Bedarf generiert werden und werden auf der Registerkarte Erklärungen (Vorschau) auf dem Dashboard für Modellerklärungen zusammengefasst.
So generieren Sie Modellerklärungen:
Wählen Sie am oberen Rand die Option Auftrag1 aus, um zum Bildschirm Modelle zurückzukehren.
Wählen Sie die Registerkarte Modelle aus.
Wählen Sie für dieses Tutorial das erste Modell MaxAbsScaler, LightGBM aus.
Wählen Sie im oberen Bereich die Schaltfläche Modell erklären aus. Auf der rechten Seite wird der Bereich Modell erklären angezeigt.
Wählen Sie den zuvor erstellten Computecluster automl-compute aus. Dieser Computecluster initiiert einen untergeordneten Auftrag, um die Modellerklärungen zu generieren.
Wählen Sie im unteren Bereich die Option Erstellen aus. Im oberen Bereich des Bildschirms wird eine grüne Erfolgsmeldung angezeigt.
Hinweis
Die Erklärbarkeitsauftrag dauert ca. zwei bis fünf Minuten.
Wählen Sie die Schaltfläche Erklärungen (Vorschau) aus. Diese Registerkarte wird nach Abschluss der Erklärbarkeitsausführung aufgefüllt.
Erweitern Sie den Bereich auf der linken Seite, und wählen Sie die Zeile aus, in der unter Features der Wert Rohdaten angegeben ist.
Wählen Sie auf der rechten Seite die Registerkarte Aggregierte Featurerelevanz aus. Dieses Diagramm zeigt, welche Datenfeatures die Vorhersagen des ausgewählten Modells beeinflusst haben.
In diesem Beispiel hatte offenbar die Dauer den größten Einfluss auf die Vorhersagen des Modells.
Bereitstellen des besten Modells
Über die Oberfläche für automatisiertes maschinelles Lernen können Sie in wenigen Schritten das beste Modell als Webdienst bereitstellen. Bei der Bereitstellung handelt es sich um die Integration des Modells, sodass neue Daten vorhergesagt und potenzielle Verkaufschancen identifiziert werden können.
In diesem Experiment bedeutet Bereitstellung in einem Webdienst, dass das Finanzinstitut nun über eine iterative und skalierbare Weblösung zur Identifizierung potenzieller Festgeldkunden verfügt.
Überprüfen Sie, ob die Ausführung des Experiments beendet ist. Navigieren Sie dazu zurück zur Seite mit dem übergeordneten Auftrag, indem Sie oben auf dem Bildschirm Auftrag1 auswählen. Oben links auf dem Bildschirm wird der Status Abgeschlossen angezeigt.
Wenn die Ausführung des Experiments abgeschlossen ist, wird die Seite Details mit dem Abschnitt Zusammenfassung des besten Modells aufgefüllt. Aus diesem Experimentkontext geht VotingEnsemble basierend auf der AUC_weighted-Metrik als bestes Modell hervor.
Wir stellen dieses Modell bereit. Die Bereitstellung dauert jedoch etwa 20Minuten. Der Bereitstellungsprozess umfasst mehrere Schritte, einschließlich der Registrierung des Modells, der Erstellung von Ressourcen und der Konfiguration dieser Ressourcen für den Webdienst.
Wählen Sie VotingEnsemble aus, um die modellspezifische Seite zu öffnen.
Wählen Sie oben links das Menü Bereitstellen und dann Für Webdienst bereitstellen aus.
Füllen Sie den Bereich Modell bereitstellen wie folgt aus:
Feld Wert „Deployment name“ (Bereitstellungsname) my-automl-deploy „Deployment description“ (Bereitstellungsbeschreibung) „Meine erste Bereitstellung eines automatisierten Machine Learning-Experiments“ Computetyp Auswählen von Azure Container Instances (ACI) Authentifizierung aktivieren Deaktivieren Sie diese Option. Use custom deployments (Benutzerdefinierte Bereitstellungen verwenden) Deaktivieren Sie diese Option. Dadurch wird die automatische Erstellung der Standardtreiberdatei (Bewertungsskript) und der Umgebungsdatei ermöglicht. In diesem Beispiel werden die im Menü Erweitert angegebenen Standardwerte verwendet.
Klicken Sie auf Bereitstellen.
Oben auf dem Bildschirm Auftrag wird eine grüne Erfolgsmeldung und im Bereich Modellzusammenfassung unter Bereitstellungsstatus eine Statusmeldung angezeigt. Wählen Sie von Zeit zu Zeit die Option Aktualisieren, um den Status der Bereitstellung zu überprüfen.
Nun haben Sie einen einsatzfähigen Webdienst, mit dem Vorhersagen generiert werden können.
Fahren Sie mit Nächste Schritte fort, um weitere Informationen zur Nutzung Ihres neuen Webdiensts zu erhalten, und testen Sie Ihre Vorhersagen mithilfe der integrierten Azure Machine Learning-Unterstützung von Power BI.
Bereinigen von Ressourcen
Bereitstellungsdateien sind größer als Daten- und Experimentdateien, sodass ihre Speicherung teurer ist. Löschen Sie nur die Bereitstellungsdateien, um die Kosten für Ihr Konto zu minimieren, oder wenn Sie den Arbeitsbereich und die Experimentdateien beibehalten möchten. Löschen Sie andernfalls die gesamte Ressourcengruppe, wenn Sie keine der Dateien verwenden möchten.
Löschen der Bereitstellungsinstanz
Löschen Sie nur die Bereitstellungsinstanz aus Azure Machine Learning unter https://ml.azure.com/, wenn Sie die Ressourcengruppe und den Arbeitsbereich für andere Tutorials und Untersuchungen behalten möchten.
Wechseln Sie zu Azure Machine Learning. Navigieren Sie zu Ihrem Arbeitsbereich, und wählen Sie links unter dem Bereich Ressourcen die Option Endpunkte aus.
Wählen Sie die zu löschende Bereitstellung aus, und klicken Sie auf Delete (Löschen).
Wählen Sie Proceed (Fortfahren) aus.
Löschen der Ressourcengruppe
Wichtig
Die von Ihnen erstellten Ressourcen können ggf. auch in anderen Azure Machine Learning-Tutorials und -Anleitungen verwendet werden.
Wenn Sie die erstellten Ressourcen nicht mehr benötigen, löschen Sie diese, damit Ihnen keine Kosten entstehen:
Wählen Sie ganz links im Azure-Portal Ressourcengruppen aus.
Wählen Sie in der Liste die Ressourcengruppe aus, die Sie erstellt haben.
Wählen Sie die Option Ressourcengruppe löschen.
Geben Sie den Ressourcengruppennamen ein. Wählen Sie anschließend die Option Löschen.
Nächste Schritte
In diesem Tutorial zum automatisierten maschinellen Lernen haben Sie über die Oberfläche für automatisiertes maschinelles Lernen von Azure Machine Learning ein Klassifizierungsmodell erstellt und bereitgestellt. Weitere Informationen und nächste Schritte finden Sie in diesen Artikeln:
Verwenden eines Webdiensts
- Weitere Informationen zu automatisiertem Machine Learning.
- Weitere Informationen zu Klassifizierungsmetriken und Diagrammen finden Sie im Artikel Grundlegendes zu den Ergebnissen des automatisierten maschinellen Lernens.
- Weitere Informationen zur Featurebereitstellung
- Weitere Informationen zur Datenprofilerstellung.
Hinweis
Dieses Bank Marketing-Dataset wird unter der Creative Commons (CCO: Public Domain)-Lizenz zur Verfügung gestellt. Alle Rechte in den einzelnen Inhalten der Datenbank sind gemäß der Database Contents License lizenziert und auf Kaggle verfügbar. Dieses Dataset war ursprünglich in der UCI Machine Learning Database verfügbar.
[Moro et al., 2014] S. Moro, P. Cortez und P. Rita. A Data-Driven Approach to Predict the Success of Bank Telemarketing. (Ein datengesteuerter Ansatz zur Prognose des Erfolgs im Bank-Telemarketing.) Decision Support Systems, Elsevier, 62:22-31, Juni 2014.
FAQs
How do I use AutoML in Azure? ›
- Sign in to Azure Machine Learning studio.
- Select your subscription and the workspace you created.
- Select Get started.
- In the left pane, select Automated ML under the Author section. ...
- Select +New automated ML job.
Azure Machine Learning provides several ways to train your models, from code-first solutions using the SDK to low-code solutions such as automated machine learning and the visual designer.
What is difference between ML and AutoML? ›AutoML is typically a platform or open source library that simplifies each step in the machine learning process, from handling a raw data set to deploying a practical ML model. In traditional machine learning, models are developed by hand, and each step in the process must be handled separately.
Will AutoML replace data scientists? ›AutoML cannot replace a data scientist's job; instead, it may help speed up a data scientist's work. AutoML (Automated Machine Learning) automates certain key components of the machine learning pipeline.
Is Azure ML easy to learn? ›Fast and easy Machine Learning product
Microsoft Azure Machine Learning provides highest availability and is very pocket friendly for any sized company. Its intelligent bot service provides great customer service by interacting them with very high speed.
The average machine learning curriculum runs around six months, although it can take years to master multiple requirements for a specific role. Not everyone has the same ML career path, so consider your own experience and skill set.
How much data do I need to train an ML model? ›Generally speaking, the rule of thumb regarding machine learning is that you need at least ten times as many rows (data points) as there are features (columns) in your dataset. This means that if your dataset has 10 columns (i.e., features), you should have at least 100 rows for optimal results.
How do I run Azure ML model locally? ›- Prerequisites.
- Prepare your local machine.
- Prepare your entry script.
- Deploy as a local web service by using Docker.
- Download and run your model directly.
- Upload a retrained model to Azure Machine Learning.
- Next steps.
- Step 1: Create a new virtual environment using Pycharm IDE.
- Step 2: Install necessary libraries.
- Step 3: Build the best machine learning model and Save it.
- Step 4: Test the loaded model.
- Step 5: Create main.py file.
- Step 6: Upload local project to Github.
- Prerequisites. For Java bots, install Maven. ...
- Plan your deployment. ...
- Sign in and select subscription. ...
- Create resource groups. ...
- Create an identity resource. ...
- Create resources with ARM templates. ...
- Update project configuration settings. ...
- Prepare your project files.
How do you train a ML model to recognize objects? ›
To train an object detection model, you provide AutoML Vision Edge a set of images with corresponding object labels and object boundaries. AutoML Vision Edge uses this dataset to train a new model in the cloud, which you can use for on-device object detection.
What steps do you need to take to train a ML model in Python? ›- Loading the dataset.
- Understanding the dataset.
- Data preprocessing.
- Data visualization.
- Building a regression model.
- Model evaluation.
- Model prediction.
- Best practices to remember while working on an ML project in a team. ...
- To install Layer, use this code. ...
- Import necessary libraries. ...
- Register and Login. ...
- Initialize Your First Layer Project. ...
- Load the Dataset. ...
- Train Model.
There are also several potential drawbacks to using Automated Machine Learning (AutoML): Black Box: AutoML can be considered a black box, as it is difficult to understand the internal workings of the algorithms and decision-making processes used by the software.
Do data scientists use AutoML? ›They are well-equipped with a variety of different skill sets, allowing them to be experts in their fields. Although AutoML is an efficient and helpful tool for speeding up machine learning development, it will not be replacing data scientists any time soon.
Why not use AutoML? ›AutoML-generated models tend to be quite complex, thus hard to analyze. Additionally, most of the time the complexity hits twice, because a complex model will take more time to run predictions, and this, in turn, makes obtaining explanations using black-box analysis tools even more burdensome.
Which is better to AI data science or ML? ›Simply put, machine learning is the link that connects Data Science and AI. That is because it's the process of learning from data over time. So, AI is the tool that helps data science get results and solutions for specific problems. However, machine learning is what helps in achieving that goal.
Is Google AutoML free? ›No, Google Cloud AutoML does not offer a free plan. Learn more about Google Cloud AutoML pricing.
What is the salary of Azure ML certification? ›Average salary for a Azure Data Engineer in India is 6.5 Lakhs per year (₹54.2k per month).
Is Azure harder to learn than AWS? ›Both Azure and AWS may be difficult to learn if you don't know what you're doing, or they can be quite simple if you're well instructed. Many IT experts, however, argue that AWS is far easier to learn and obtain certification in.
Can a non it person learn Azure? ›
Yes! There is no pre-requisite in learning Azure and the AZ-900 in this platform will help you understand Azure basics and for sure can make you explain what each and every offering Azure currently has.
Can I master machine learning in 6 months? ›It is quite possible to learn, follow and contribute to state-of-art work in deep learning in about 6 months' time. This article details out the steps to achieve that. - You have some programming skills. You should be comfortable to pick up Python along the way.
When should I stop training ML model? ›Therefore, the epoch when the validation error starts to increase is precisely when the model is overfitting to the training set and does not generalize new data correctly. This is when we need to stop our training.
How much does it cost to train AI? ›The report found that the cost of training a single large AI model can range from $3 million to $12 million. The cost of training a model on a large dataset can be even higher, reaching up to $30 million. OpenAI estimates that the cost of training a model on a large dataset will increase to $500 million by 2030.
What is the rule of 10 in machine learning? ›The most common way to define whether a data set is sufficient is to apply a 10 times rule. This rule means that the amount of input data (i.e., the number of examples) should be ten times more than the number of degrees of freedom a model has. Usually, degrees of freedom mean parameters in your data set.
What is a good score for ML model? ›Good accuracy in machine learning is subjective. But in our opinion, anything greater than 70% is a great model performance. In fact, an accuracy measure of anything between 70%-90% is not only ideal, it's realistic. This is also consistent with industry standards.
How many ML models make it to production? ›As VentureBeat reports, around 90 percent of machine learning models never make it into production.
How do I connect to Azure VM from local machine? ›- Go to the Azure portal to connect to a VM. ...
- Select the virtual machine from the list.
- At the beginning of the virtual machine page, select Connect.
- On the Connect to virtual machine page, select RDP, and then select the appropriate IP address and Port number.
- On this page.
- Before you begin.
- Store your model in Cloud Storage. Set up your Cloud Storage bucket. Upload the exported model to Cloud Storage. Upload custom code.
- Test your model with local predictions.
- Deploy models and versions. Create a model resource. Create a model version.
Prerequisites. Python installed version 3.7 or later. For azureml-automl packages, use only version 3.7 or 3.8.
How to build a machine learning model in 10 minutes? ›
- 10 Minutes to Building a Machine Learning Pipeline with Apache Airflow. ...
- Sign in to Google Cloud Platform and Create a Compute Instance. ...
- Pull the Trained Model from Github. ...
- Overview of ML Pipeline components. ...
- Install Docker and Set up Virtual Hosts Using nginx. ...
- Build and Run Docker Container.
To give inputs to a machine learning model, you have to create a NumPy array, where you have to input the values of the features you used to train your machine learning model. Then we can use that array in the model. predict() method, and at the end, it will give the predicted value as an output based on the inputs.
How to track ML models? ›The most straightforward way to monitor your ML model is to constantly evaluate your performance on real-world data. You could customize triggers to notify you of significant changes in metrics such as accuracy, precision, or F1.
How do I connect my Azure bot to my database? ›- Launch Visual Studio.
- File -> Open -> Project/Solution.
- Navigate to your Bot project folder e.g., EntityFrameworkTranscriptStoreExample.
- Select your Bot project file e.g., EntityFrameworkTranscriptStoreExample.csproj file.
- Press F5 to run the project.
Azure Bot Service provides what you need to build, connect, test, deploy, monitor, and manage bots. Bot Service provides the core components for creating bots, including the Bot Builder SDK for developing bots and the Bot Framework for connecting bots to channels.
How do I create a chatbot in Azure? ›- Go to the Azure portal.
- In the right pane, select Create a resource.
- In the search box enter bot, then press Enter.
- Select the Azure Bot card.
- Select Create.
- Enter the required values.
- Select Review + create.
- If the validation passes, select Create.
- Collecting Data: As you know, machines initially learn from the data that you give them. ...
- Preparing the Data: After you have your data, you have to prepare it. ...
- Choosing a Model: ...
- Training the Model: ...
- Evaluating the Model: ...
- Parameter Tuning: ...
- Making Predictions.
Popular algorithms used to perform object detection include convolutional neural networks (R-CNN, Region-Based Convolutional Neural Networks), Fast R-CNN, and YOLO (You Only Look Once). The R-CNN's are in the R-CNN family, while YOLO is part of the single-shot detector family.
How do you check model accuracy in ML? ›Accuracy score in machine learning is an evaluation metric that measures the number of correct predictions made by a model in relation to the total number of predictions made. We calculate it by dividing the number of correct predictions by the total number of predictions.
What are the key steps in the AutoML process? ›There are generally eight steps in the AutoML process: data ingestion, data preparation, data engineering, model selection, model training, hyperparameter tuning, model deployment, and model updates.
What is the difference between test data and train data? ›
The main difference between training data and testing data is that training data is the subset of original data that is used to train the machine learning model, whereas testing data is used to check the accuracy of the model. The training dataset is generally larger in size compared to the testing dataset.
Which Python library is generally used to train ML models? ›Which is the most widely used package for machine learning in Python? For conventional ML algorithms, Scikit-learn is one of the most used ML libraries. It is based on two fundamental Python libraries, NumPy and SciPy. Most supervised and unsupervised learning algorithms are supported by Scikit-learn.
What are the main 3 types of ML models? ›Amazon ML supports three types of ML models: binary classification, multiclass classification, and regression.
How many images do you need to train a machine learning model? ›Usually around 100 images are sufficient to train a class. If the images in a class are very similar, fewer images might be sufficient. the training images are representative of the variation typically found within the class.
What is Azure AutoML? ›Azure AutoML is a cloud-based service that can be used to automate building machine learning pipelines for classification, regression and forecasting tasks.
How to use AutoML API? ›- Create your own search space. C# Copy. ...
- Create a sweepable estimator and add it to your pipeline. C# Copy. ...
- Create a custom trial runner. ...
- Initialize your custom trial runner. ...
- Create and configure your experiment. ...
- Run your experiment.
There are two different services: Vision API and AutoML vision. Vision API can be used to detect objects and faces, read printed and handwritten text, and build valuable metadata into your image catalog, while AutoML Vision can be used to automate the training of your own custom machine learning models.
What are 4 processes of Azure automated machine learning? ›Using Azure Machine Learning, you can design and run your automated ML training experiments with these steps: Identify the ML problem to be solved: classification, forecasting, regression, computer vision or NLP.
What are the disadvantages of AutoML? ›The main criticisms of AutoML solutions are: 1 Control - Can't alter generated solutions. 2 It doesn't do enough - Most of the work is elsewhere. 3 Quality of results - Users don't want to be held back.
What is the difference between AutoML and auto Sklearn? ›Automated Machine Learning (AutoML) refers to techniques for automatically discovering well-performing models for predictive modeling tasks with very little user involvement. Auto-Sklearn is an open-source library for performing AutoML in Python.
Is AutoML free? ›
Model training costs
And for your first models, there is a free trial. You get six free node hours for training and batch prediction.
Feature | Monthly usage | Price |
---|---|---|
Text translation (TXT, HTML, and XLSX formats) | 0-500k | Free |
500k-250M | $80 per million characters | |
250M-2.5B | $60 per million characters | |
2.5B-4B | $40 per million characters |
- Step 1: Preprocessing of Data. ...
- Step 2: Feature Engineering. ...
- Step 3: Diverse Algorithms. ...
- Step 4: Algorithm Selection. ...
- Step 5: Training and Tuning. ...
- Step 6: Ensembling. ...
- Step 7: Head-to-Head Model Competitions. ...
- Step 8: Human-Friendly Insights.
Model selection and automation of the process of hyperparameter optimization, also known as tuning, are the AutoML's most valuable features. This requires the use of various techniques.
How good is Google AutoML? ›Powerful and efficient tool which has taken AI and ML to the next level. Google cloud autoML is one of the best tool to create data models. It provides large no of algorithms and ML techniques support.
Which companies use AutoML? ›Company Name | Website | HQ Address |
---|---|---|
ADT | adt.com | 1501 W Yamato Rd |
Tapad | tapad.com | 551 5th Ave, Fl 9 |
Nationstar Mortgage | mrcoopergroup.com | 8950 Cypress Waters Blvd |
BNSF Railway | bnsf.com | 2650 Lou Menk Dr |
We have compiled a list of solutions that reviewers voted as the best overall alternatives and competitors to Google Cloud AutoML, including TensorFlow, Azure Machine Learning Studio, Amazon SageMaker, and H2O.