MLKitSample

https://gdg-tokyo.connpass.com/event/95203/ の課題です。

資料

https://speakerdeck.com/yanzm/first-step-of-ml-kit

ステップ1

このプロジェクトを clone する
start branch に変更する git checkout start
Android Studio を起動する
Import project で clone したディレクトリを指定して開く
gradle の sync が終わるまで待つ
（やりたい人は applicationId やパッケージ名を変える）

課題1

firebase console https://console.firebase.google.com/ で新しいプロジェクトを作る。

プロジェクト名 : 好きな名前（例 ML Kit Sample）
国 / 地域 : 日本

課題2

作った firebase プロジェクトに Android アプリを追加する（「Android アプリに Firebase を追加」を選択する）
google-services.json をダウンロードし、app モジュール直下に置く
アプリを実行する

dependency に

implementation "com.google.firebase:firebase-ml-vision:18.0.2"

を追加する。

課題3 : テキスト認識

https://firebase.google.com/docs/ml-kit/android/recognize-text#on-device

「TODO: 1 on-device テキスト認識」を実装する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .onDeviceTextRecognizer
    .processImage(image)
    .addOnSuccessListener { texts ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        for (block in texts.textBlocks) {
            for (line in block.lines) {
                for (element in line.elements) {
                    element.boundingBox?.let {
                        overlay.add(BoxData(element.text, it))
                    }
                }
            }
        }
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

課題4 : 顔検出

https://firebase.google.com/docs/ml-kit/android/detect-faces#on-device

「TODO: 2 on-device 顔検出」を実装する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .visionFaceDetector
    .detectInImage(image)
    .addOnSuccessListener { faces ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        for (face in faces) {
            face.boundingBox?.let {
                overlay.add(BoxData(face.smilingProbability.toString(), it))
            }
        }
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

課題5 : 顔検出

option を指定する。

setPerformanceMode() では速度優先か正確性優先かを指定できる。
setLandmarkMode() では eyes, ears, nose, cheeks, mouth の位置を検出するかどうかを指定できる。
setClassificationMode() では笑顔の度合い（0f〜1f）、目の開き具合（0f〜1f）を検出するかどうかを指定できる。
setMinFaceSize() では検出する最小の顔の大きさを画像に対する比率で指定できる。
enableTracking() では顔に id を割り振るかどうかを指定できる。

val options = FirebaseVisionFaceDetectorOptions.Builder()
    .setPerformanceMode(FirebaseVisionFaceDetectorOptions.ACCURATE) // or FAST
    .setLandmarkMode(FirebaseVisionFaceDetectorOptions.ALL_LANDMARKS) // or NO_LANDMARKS
    .setClassificationMode(FirebaseVisionFaceDetectorOptions.ALL_CLASSIFICATIONS) // or NO_CLASSIFICATIONS
    .setContourMode(FirebaseVisionFaceDetectorOptions.NO_CONTOURS) // or ALL_CONTOURS
    .setMinFaceSize(0.15f)
    .enableTracking()
    .build()

FirebaseVision.getInstance()
    .getVisionFaceDetector(options)
    .detectInImage(image)
    .addOnSuccessListener { faces ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        for (face in faces) {
            face.boundingBox?.let {
                overlay.add(BoxData(face.smilingProbability.toString(), it))
            }
        }
    }
    ...

課題6 : バーコードスキャン

https://firebase.google.com/docs/ml-kit/android/read-barcodes#configure-the-barcode-detector

「TODO: 3 on-device バーコードスキャン」を実装する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .visionBarcodeDetector
    .detectInImage(image)
    .addOnSuccessListener { barcodes ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        for (barcode in barcodes) {
            barcode.boundingBox?.let {
                overlay.add(BoxData(barcode.rawValue ?: "", it))
            }
        }
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

おまけ : option を指定する。option では検出するバーコードの種類を制限できる。

val options = FirebaseVisionBarcodeDetectorOptions.Builder()
    .setBarcodeFormats(
        FirebaseVisionBarcode.FORMAT_EAN_8,
        FirebaseVisionBarcode.FORMAT_EAN_13
    )
    .build()

FirebaseVision.getInstance()
    .getVisionBarcodeDetector(options)
    .detectInImage(image)
    ...

課題7 : 画像のラベル付け

https://firebase.google.com/docs/ml-kit/android/label-images#on-device

「TODO: 4 on-device ラベルづけ」を実装する。

dependency に

implementation 'com.google.firebase:firebase-ml-vision-image-label-model:15.0.0'

を追加する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .visionLabelDetector
    .detectInImage(image)
    .addOnSuccessListener { labels ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        overlay.add(TextsData(labels.map { "${it.label}, ${it.confidence}" }))
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

おまけ : option を指定する。

デフォルトでは確率の高い方から 10 個出力されるが、ConfidenceThreshold を指定すると、それ以上の確率のものだけが出力される。

val options = FirebaseVisionLabelDetectorOptions.Builder()
    .setConfidenceThreshold(0.8f)
    .build()

FirebaseVision.getInstance()
    .getVisionLabelDetector(options)
    .detectInImage(image)

課題8 : Cloud API

Cloud API を利用するには Plan を Blaze に変更する必要がある。課金設定を行える人だけやってみる。

https://console.firebase.google.com/ の左メニューの一番下の項目で Plan を Blaze に変える。

左メニューの [開発] - [ML Kit] をクリックし、右側の [Cloud API の使用状況] をクリックし、 Cloud Vision API を有効にする。

課題9 : テキスト認識 Cloud API

https://firebase.google.com/docs/ml-kit/android/recognize-text#cloud-based

「TODO: 5 cloud テキスト認識」を実装する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .cloudTextRecognizer
    .processImage(image)
    .addOnSuccessListener { cloudText ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        for (block in cloudText.textBlocks) {
            for (line in block.lines) {
                for (element in line.elements) {
                    element.boundingBox?.let {
                        overlay.add(BoxData(element.text, it))
                    }
                }
            }
        }
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

おまけ : option を指定する。

val options = FirebaseVisionCloudTextRecognizerOptions.Builder()
    .setModelType(FirebaseVisionCloudDetectorOptions.LATEST_MODEL)
    .setModelType(FirebaseVisionCloudTextRecognizerOptions.DENSE_MODEL)
    .setLanguageHints(listOf("jp"))
    .build()

FirebaseVision.getInstance()
    .getCloudTextRecognizer(options)
    .processImage(image)
    ...

課題10 : 画像のラベル付け Cloud API

https://firebase.google.com/docs/ml-kit/android/label-images#cloud-based

「TODO: 6 cloud ラベルづけ」を実装する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .visionCloudLabelDetector
    .detectInImage(image)
    .addOnSuccessListener { labels ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        overlay.add(TextsData(labels.map { "${it.label}, ${it.confidence}" }))
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

おまけ : option を指定する。

val options = FirebaseVisionCloudDetectorOptions.Builder()
    .setModelType(FirebaseVisionCloudDetectorOptions.LATEST_MODEL)
    .setMaxResults(15)
    .build()

FirebaseVision.getInstance()
    .getVisionCloudLabelDetector(options)
    .detectInImage(image)
    ...

課題11 : ランドマーク認識 Cloud API

https://firebase.google.com/docs/ml-kit/android/recognize-landmarks#configure-the-landmark-detector

「TODO: 6 cloud TODO: 7 cloud ランドマーク認識」を実装する。

detectButton.isEnabled = false
progressBar.visibility = View.VISIBLE

val image = FirebaseVisionImage.fromBitmap(bitmap)

FirebaseVision.getInstance()
    .visionCloudLandmarkDetector
    .detectInImage(image)
    .addOnSuccessListener { labels ->
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE

        labels.forEach {
            if (it.boundingBox != null) {
                overlay.add(
                    BoxData(
                        "${it.landmark}, ${it.confidence}",
                        it.boundingBox!!
                    )
                )
            }
        }
    }
    .addOnFailureListener { e ->
        e.printStackTrace()
        detectButton.isEnabled = true
        progressBar.visibility = View.GONE
        Toast.makeText(this, e.message, Toast.LENGTH_SHORT).show()
    }

おまけ : option を指定する。

val options = FirebaseVisionCloudDetectorOptions.Builder()
    .setModelType(FirebaseVisionCloudDetectorOptions.LATEST_MODEL)
    .setMaxResults(15)
    .build()

FirebaseVision.getInstance()
    .getVisionCloudLandmarkDetector(options)
    .detectInImage(image)
    ...

課題12

以下の meta-data を AndroidManifest に宣言すると、インストール時に on-device の ML model が自動でダウンロードされる。この設定を行わない場合、on-device API を最初に実行したときに model がダウンロードされる。ダウンロードが完了する前の API リクエストは無視される。

<application ...>

    <meta-data
        android:name="com.google.firebase.ml.vision.DEPENDENCIES"
        android:value="ocr,face,barcode,label" />

</application>

ocr : テキスト認識
face : 顔検出
barcode : バーコードスキャン
label : ラベルづけ

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.idea/codeStyles		.idea/codeStyles
app		app
gradle/wrapper		gradle/wrapper
screenshots		screenshots
.gitignore		.gitignore
README.md		README.md
build.gradle		build.gradle
gradlew		gradlew
gradlew.bat		gradlew.bat
settings.gradle		settings.gradle

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MLKitSample

資料

ステップ1

課題1

課題2

課題3 : テキスト認識

課題4 : 顔検出

課題5 : 顔検出

課題6 : バーコードスキャン

課題7 : 画像のラベル付け

課題8 : Cloud API

課題9 : テキスト認識 Cloud API

課題10 : 画像のラベル付け Cloud API

課題11 : ランドマーク認識 Cloud API

課題12

About

Releases

Packages

Languages

yanzm/MLKitSample

Folders and files

Latest commit

History

Repository files navigation

MLKitSample

資料

ステップ1

課題1

課題2

課題3 : テキスト認識

課題4 : 顔検出

課題5 : 顔検出

課題6 : バーコードスキャン

課題7 : 画像のラベル付け

課題8 : Cloud API

課題9 : テキスト認識 Cloud API

課題10 : 画像のラベル付け Cloud API

課題11 : ランドマーク認識 Cloud API

課題12

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages