Hướng dẫn cài đặt voice text cloud

Hiện tại có rất nhiều nhà cung cấp hỗ trợ service nhận diện giọng nói từ file sang văn bản, nổi bật nhất trong đó có lẽ là service từ Google Cloud. Hôm nay mình sẽ hướng dẫn các bạn cách setup và sử dụng service này trên nền tảng NodeJS.

Đăng kí tài khoản Google Cloud

Để sử dụng service của Google Cloud, trước tiên chúng ta cần đăng kí tài khoản: //console.cloud.google.com/freetrial/signup/

Điền đầy đủ thông tin yêu cầu ở bước 2, lưu ý Google Cloud yêu cầu người dùng cung cấp thông tin thẻ Visa, Master Card mới có thể đăng kí tài khoản (hiện tại Google không chấp nhận thẻ Master Card ảo, nên không thể dùng thẻ Master Card ảo đăng kí bằng Viettel Pay hay bên bất kì nào nhé).

Sau khi tạo thành công tài khoản, ta vào Dashboard của Google Cloud và tạo một chứng thực (credential) và lưu về máy.

Set biến môi trường ở máy của bạn, cho phép gọi APIs mà Google cung cấp với credential đã tải về

Với Linux/MacOS
Với Window:

II. Tạo Project NodeJS

Tạo thư mục chứa project, đặt tên CloudSpeech
Mở terminal, đi đến thư mục đã tạo, chạy câu lệnh “npm init” (Yêu cầu máy của bạn phải cài NodeJs rồi nhé)
Điền các thông tin cần thiết (nếu có), và nhấn enter để tiếp tục

4. Tạo file index.js bằng câu lệnh “echo > index.js” hoặc tự tạo bằng tay nhé

5. Install package: “npm install @google-cloud/speech”

6. Google Cloud có rất nhiều project sample như convert file voice to text, nhận diện giọng nói từ microphone, ở đây mình sẽ demo với project infinite streaming: //github.com/googleapis/nodejs-speech/blob/master/samples/infiniteStreaming.js

7. Các bạn copy hết source ở trên và bỏ vào file index.js đã tạo ở trên nhé.

8. Install các package cần thiết: + “npm i chalk” + “npm i node-record-lpcm16”

9. Để project nhận diện được voice từ micro và convert sang đúng định dạng mà Google Cloud Speech yêu cầu ta cần dùng SoX, install Sox tại: //sox.sourceforge.net/

Hiện tại version 14.4.2 đang gặp một số lỗi nên chúng ta sẽ install version 14.4.1

Với MacOS thì đơn giản hơn, chúng ta chỉ cần chạy câu lệnh “brew install sox” với terminal, không cần tự tải.

III. Config

Các bạn mở file index.js lên, trong function main, chúng ta có thể điều chỉnh languageCode về ngôn ngữ chúng ta nói để bộ nhận diện sẽ detect chính xác hơn. Ví dụ nếu bạn nói tiếng Việt thì chuyển ‘en-US’ về ‘vi-VN’.

IV. Run project bằng câu lệnh: “node index.js” , bây giờ chúng ta đã có thể nói vào micro, Google APIs sẽ tự detect ra text và show kết quả lên console.

Để sử dụng Jarvis Bot Assistant bạn phải đăng ký sử dụng Google Cloud Speech to Text API vào tạo file bot.json. Việc đăng ký không quá phức tạp nhưng phải yêu cầu bạn có thẻ VISA hoặc MASTERCARD (thẻ cứng vật lý, hiện tại các thẻ ảo như Viettel Pay mình thử không sử dụng được).

Speech-to-Text là ứng dụng chuyển đổi ngôn ngữ tự nhiên thông qua giọng nói (âm thanh) thành văn bản (chữ) thông qua hệ thông Machine Learing. Bản thân Speech-to-Text của Google vô cùng mạnh mẽ có thể xử lý rất nhiều ngôn ngữ khác nhau (120 ngôn ngữ) bao gồm cả tiếng Việt với độ chính xác cao (trong điều kiện dữ liệu đầu vào – microphone có chất lượng tương đối tốt).

Speech-to-Text cho phép tích hợp dễ dàng các công nghệ nhận dạng giọng nói của Google vào các ứng dụng dành cho nhà phát triển. Gửi dữ liệu âm thanh và trả về dữ liệu dạng văn bản từ dịch vụ API Speech-to-Text.

Google Speech-to-Text cần trả phí?

Đối với người dùng thông thường, Google miễn phí 60 phút xử lý âm thanh (chuyển thành ngôn ngữ) vượt quá 60 phút chúng ta phải trả phí ứng với số tiền mỗi 15 giây.

Đăng ký Google Speech to Text API

Các bạn cứ làm tuần tự các bước sau đây để đăng ký Google Speech to Text API, cũng không quá phực tạp đâu.

Mở trang //cloud.google.com/speech-to-text/ ấn TRY IT FREE và tiến hành đăng nhập bằng tài khoản Google.

Chọn Country là Vietnam tích Terms of Service và bấm Continue.

Nhập các nội dung cần thiết và điền thẻ VISA/MASTERCARD và ấn START MY FREE TRIAL. Mặc định ban đầu Google sẽ tặng bạn 300$ vào tài khoản sử dụng trong 1 năm, tha hồ sử dụng các dịch vụ. Hết 1 năm ta tính sau.

Sau đó chúng ta khởi tạo một Project mới, mình đặt tên là: Speech và ấn CREATE.

Sau khi khởi tạo xong Project, chọn Project và ấn Open (nếu bạn chỉ có 1 project thì không cần).

Tại khung tìm kiếm gõ: speech và chọn Cloud Speech-to-Text API.

Click ENABLE để kích hoạt API.

Để sử dụng được API chúng ta phải tạo CREDENTIAL bằng cách click CREATE CREDENTIAL.

Tại mục Which API are you using? chọn Cloud Speech-to-Text API và click What credentials do i need?

Thực chất chúng ta không phải tạo Credential nào cả, Speech-to-Text có thể sử dụng Credential mặc định.

Sau đó ta chọn Manage service acounts.

Chọn CREAT SERVICE ACCOUNT.

Nhập các nội dung cần thiết và ấn CREAT và CONTINUE.

Kéo xuống và ấn CREATE KEY và chọn JSON để xuất key dưới dạng Json để sử dụng với Jarvis Bot Assistant. Sau đó Save file dưới tên bot.json.

Cấu trúc của file bot.json vừa tạo sẽ như sau:

OK, vậy là chúng ta có file bot.json để sử dụng cho Jarvis Bot Assistant rồi. Sau khi tạo file thành công, để kích hoạt các API khác như: Text-to-Speech… bạn chỉ cần ENABLE API, không phải làm các bước sau nữa.

Hướng dẫn cài đặt voice text cloud

Google Speech-to-Text cần trả phí?

Đăng ký Google Speech to Text API

Bài Viết Liên Quan

Hướng dẫn lập trình assembly

Hướng dẫn cách vẽ xương cá trên word

Hướng dẫn thêm nhân viên trong phần mềm smile hr

Hướng dẫn sử dụng microsoft project 2010 pdf

Clip hướng dẫn làm ọt kem milkfoam

Hướng dẫn dăng kí phần mềm kbhxh

Hướng dẫn kế toán lĩnh vực trồng trọt

Hướng dẫn khôi phục tin nhắn đồng bộ trên gmail

Hướng dẫn ghi đĩa trên win 10

Hướng dẫn chọn cáp thép theo điều kiện làm việc

Toplist

Top 19 đặt một câu ghép chính phụ sử dụng cặp quan hệ từ để thi 2022

Top 29 suy thận độ 2 kiêng ăn gì 2022

Top 10 triển vọng thị trường chứng khoán việt nam sách 2022

Top 9 trong các tài sản sau đây tài sản nào thuộc sở hữu của nhà nước 2022

Top 10 giáo an phát triển năng lực môn kĩ thuật lớp 4 2022

Top 8 chuẩn mực đạo đức của vinamilk 2022

Top 28 kế hoạch bài dạy môn tự nhiên xã hội lớp 2 mô đun 4 2022

Top 10 de thi giữa học kì 1 lớp 10 môn lý có đáp an tự luận 2022

Top 9 huyện hoài đức - hà nội có bao nhiều xã 2022

Bài mới nhất

Mã lỗi máy lạnh panasonic inverter nội địa năm 2024

Top jaron một nam diễn viên của đài ch3 c năm 2024

Tiếng chim trong vườn bác của nhạc sĩ nào năm 2024

Coông tác chính sách ở huyện hướng hóa năm 2024

Iphone bị lỗi tắt nguồn có sao ko năm 2024

Chồng tuổi tân mùi thì hợp với hướng nhà nào năm 2024

Bài tập về giá trị tuyệt đối có đáp án năm 2024

Bộ điều khiển hóa chất hồ bơi hana năm 2024

Cho thuê nhà số 71 hoàng văn thụ hải phòng năm 2024

Bảng cân đối kế toán the hien thue gtgt năm 2024

Chủ đề