Lien de la note Hackmd
Sans expertise en ML != Sans ML
Intro
Who are we ?
Laurent Picard
- Developer advocate - Google Cloud
- Ebook pioner
Any sufficiently advanced technology is indistiguishable from magic
- Arthur C. Clarke
What is machine learning ?
Why is machine learning now possible ?
Three ways we can benefit from ML today
Ne reiventez pas la roue !
Nouveau champ: auto-ML
- on peut construire nos propres models sans expertise
Machine learning API
Ready-to-use models
Vision API
Computer vision before ML:
Landmark detection:
Capable de determiner ou a ete prise la photo (quel endroit)
La photo originale a ete modifiee (symetrie horizontale)
- Toujours capable de determiner l’origine de la photo
Object detection:
Face detection:
Vue 3D de Gollum donc pas un vrai visage humain (mais marche quand meme !)
Text detection:
Meme avec une legere rotation, on detecte toujours le texte
Detecte egalement l’ecriture manuscrite (quelques erreurs)
Web entity detection and image matching: La photo ci-dessus de Tolkien est totalement inedite pour l’API utilisee, capable de reconnaitre Tolkien + determiner que l’origine est un journal espagnol
OSS Client libraries
Librairies clientes en open-source sur GitHub dans plusieurs langages.
Video Intelligence API
Demo:
OSS Client libraries
Natural Language API
Analyze text with a simple request
Syntax analysis:
Entity detection
Content classification
Sentiment analysis:
Le ML se plante totalement sur la detection du sarcasme.
Translation API
Google Translate par exemple!
On peut les ameliorer regulierement en fournissant de plus en plus d’exemples et de contre-exemples.
Speech-to-Text API
Convert text to speech in 120 languages with a simple request.
Fonctionne en temps reel.
Ex: il y a quelques annees repeter a un bot en appelant une banque “Je veux un conseiller” en esperant qu’il comprenne.
Consequence sympa des reseaux neuronaux: aujourd’hui les speech-to-text API sont resistants aux bruits car ils apprennent a partir de vrais echantillon.
Speech timestamps: Search for text within your audio
OSS Client libraries
Text-to-speech (TTS) API
Generate natural speech with a simple request
WaveNet natural voices, par Deepmind
C’est le modele le plus avance de tous, qui reproduit le mieux une voix humaine.
Demo: “Quelle est la temperature a Paris ?” avec un accent anglais Tadaaaaaa
OSS Client libraries
Tuto pour generer des voix
AutoML
Build your custom model with no expertise
Generic results with the Vision API
Cloud AutoML
Demo:
Utilisation de ~250 images en moyennes
“Juste” 3h de calculs.