Goog411 Voice Search And Speech Recognition

A+ A-

Tim O'Reilly memiliki sebuah posting menarik yang naik Jumat lalu pada motivasi potensi Google dalam menggelar Goog411. Jawaban yang jelas untuk pertanyaan “Mengapa Google melakukan hal ini?” Adalah pencarian suara mobile dan bantuan direktori ($ 13 miliar dalam pendapatan tahunan per Opus Research). Kebijaksanaan konvensional, yang meliputi saya di sini, menyatakan bahwa Google ingin menawarkan produk pencarian mobile yang menyentuh perilaku konsumen yang ada (yaitu, bantuan direktori) dan menawarkan prospek iklan - akhirnya.


Saat 1-800-Free411 adalah pemimpin di pasar bantuan direktori bebas didukung iklan. Tapi kembali ke pos O'Reilly. Dia menyarankan:

Tetapi juga tampaknya bagi saya bahwa ada cerita tersembunyi di sini tentang pengenalan suara itu sendiri. Saya sedang berbicara baru-baru ini untuk Eckart Walther dari Yahoo !, yang digunakan untuk berada di Tellme, dan ia menunjukkan bahwa pidato pengakuan mengambil lompatan besar dalam kemampuan ketika pengenalan suara otomatis mulai digunakan untuk bantuan direktori. Tiba-tiba, ada jutaan suara, jutaan aksen untuk melatih sistem pengenalan suara pada, dan jauh lebih sedikit kebutuhan untuk pengguna individu untuk melatih sistem.

Hal ini mengingatkan komentar yang Peter Norvig, Direktur Riset di Google, dibuat untuk saya tahun lalu tentang terjemahan otomatis, dan mengapa itu menjadi lebih baik. “Kami tidak memiliki algoritma yang lebih baik. Kami hanya memiliki lebih banyak data.”

Singkatnya, saya berspekulasi bahwa layanan 1-800-GOOG-411 dirancang untuk memanen data suara untuk membangun database pidato Google sendiri, daripada lisensi dari Nuance atau pemain lain.

Ketika saya berbicara dengan Google tentang peluncuran Goog411 mereka mengatakan bahwa tidak jelas mereka pernah melayani iklan terhadap Voice Search. Mereka juga mengatakan bahwa salah satu motif mereka dalam bergerak dari semi-siluman 877-520-Cari untuk Goog411 adalah untuk membukanya hingga volume panggilan lebih banyak untuk membuat sistem yang lebih baik. recognizers pidato harus terkena suara orang-orang disempurnakan dan ditingkatkan. Dan, dalam pengertian ini, Goog411 secara eksplisit tawaran untuk paparan lebih dan panggilan ke layanan.

Google jarang melakukan sesuatu untuk alasan tunggal; perusahaan biasanya memiliki beberapa alasan untuk tindakan-tindakannya dalam pengalaman saya. Tapi itu sangat mungkin bahwa O'Reilly adalah benar dan bahwa Google sebagian menggunakan Goog411 untuk membangun database pidato nya.

Ini tidak mungkin namun yang bantuan direktori didukung iklan jauh dari pikiran Google. Tapi yang lebih penting adalah memiliki produk pencarian suara karena, seperti yang telah saya berpendapat sebelumnya, yang mana beberapa konsentrasi terbesar “mobile pencarian lokal” penggunaan terlalu. Dan Google ingin menjadi mana penggunaan ini.