Съдържание:

Добавете Trigger Start Sound към Google AIY Voice Kit: 6 стъпки (със снимки)
Добавете Trigger Start Sound към Google AIY Voice Kit: 6 стъпки (със снимки)

Видео: Добавете Trigger Start Sound към Google AIY Voice Kit: 6 стъпки (със снимки)

Видео: Добавете Trigger Start Sound към Google AIY Voice Kit: 6 стъпки (със снимки)
Видео: Жена е бременна от 13 години, но бебето още не се е родило 2024, Юли
Anonim
Image
Image
Стъпка 2: Проверете файла Voicehat.py за повече информация
Стъпка 2: Проверете файла Voicehat.py за повече информация

Този урок е доста прост. Наистина се наслаждавах на Google AIY Voice Kit, но наистина харесвам шума, който издават в нормалния си Google Home, за да потвърдят, че слушат активно. Това не е настроено по подразбиране в нито един от примерите, които са предварително заредени в изображението на AIY Voice Kit.

Включвам и връзка към фондовия Старт и Потвърждаване на шумовете, които съм записал от реалния си Google Home с рекордера си Zoom.

Ето го-моят първи инструктаж!

Стъпка 1: Необходими материали и файлове

  1. Напълно функционален Google AIY Voice Kit, за да настроите вашия комплект, посетете официалната страница AIY Voice Kit.
  2. Възможност за достъп до терминала на вашия Pi чрез SSH, VNC или с монитор и клавиатура
  3. . Wav файл, който искате да възпроизведете, когато Pi слуша за гласово въвеждане-Ако не използвате персонализиран файл, изтеглете стандартен файл "St art Talking" тук или го изтеглете от прикачения линк.
  4. (По избор) Аудио редактор, който може да конвертира файлове и да променя техния бит и честота на дискретизация

Стъпка 2: Стъпка 2: Проверете файла Voicehat.py за повече информация

ВАЖНО

Не използвам най-новото изображение на моя гласов комплект, който включва кода както за комплекта Voice, така и Vision (т.е. aiyprojects-2018-01-03.img). Използвам кода от клона Voice Kit, който може да се намери в Google AIY Raspbian GitHub. Моето лично мнение е просто да използвам клона Voice Kit, за да го опростя и да не се налага да се занимавам с кода на Vision, когато работите с вашия гласов комплект

Преместване на…

Тази стъпка не е напълно задължителна, но ще ви покаже къде Google е заровил инструкциите за това как да работи, ако искате да направите още една стъпка или да разберете защо кодът, който добавям, работи.

pi@raspberry: cd AIY-voice-kit-python/src/aiy/

След това ще проверим файла voicehat.py в тази папка:

pi@raspberry: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

Прикачената снимка показва къде можете да научите за потребителския интерфейс на състоянието и как да използвате звук по време на задействане.

Добре, сега нека добавим малко код към един от примерните файлове, за да работи това нещо.

Стъпка 3: Стъпка 3: Добавете звуков код за задействане към демо кода

Стъпка 3: Добавете звуков код за задействане към демо кода
Стъпка 3: Добавете звуков код за задействане към демо кода

Първо отидете до папката AIY-voice-kit-python и стартирайте изходния код

cd AIY-voice-kit-python

източник env/bin/активира

cd src

След това използвайте „sudo nano“или в „assistant_grpc_demo.py“, или в „assistant_library_demo.py“

Разликата между двата файла е, че assistant_grpc_demo.py използва бутона, за да задейства Google Assistant, а assistant_library_demo.py използва думата за активиране „Ok, Google“, за да задейства Google Assistant.

За двата файла трябва само да добавите ЕДИН ред код:

status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav')

Това предполага, че сте поставили началния звук в папката/home/pi/и сте го кръстили googlestart.wav. Променете ги въз основа на това, което сте кръстили вашия файл и където и да го намерите.

Редът на кода, който търсим, е по -долу:

status_ui.status ('слушане')

Искаме да добавим нашия нов ред код ПРЕД този ред код …

За примера „assistant_library_demo.py“може да се намери тук:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# И сега добавете нашия код status_ui.set_trigger_sound_wave ('home/pi/googlestart.wav') status_ui.status ('слушане')

За примера „assistant_grpc_demo.py“може да се намери тук:

button.wait_for_press ()

# И сега добавете нашия код status_ui.set_trigger_sound_wave ('/home/pi/googlestart.wav') status_ui.status ('слушане')

Това предполага, че сте поставили началния звук в папката/home/pi/и сте го кръстили googlestart.wav. Променете ги въз основа на това, което сте кръстили вашия файл и където и да го намерите.

Натиснете CTRL-X & Y, за да запазите всичко.

*** ЗАБЕЛЕЖКА: Намерих нещо малко глупаво. За „assistant_library_demo.py“добавянето на задействащия звук изглежда не прави никаква разлика във функцията за разпознаване на реч. За „assistant_grpc_demo.py“обаче изглежда, че когато имате задействащ звук, той прекъсва първите две думи, които казвате. Не съм напълно сигурен защо. Все още се опитвам да го разбера.

Стъпка 4: Стъпка 4: Стартирайте кода и се уверете, че всичко е наред

pi@raspberry: cd AIY-voice-kit-python

и заредете virtualenv

pi@raspberry: ~/AIY-voice-kit-python $ source env/bin/активира

и го стартирайте!

(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_library_demo.py

или

(env) pi@raspberry: ~/AIY-voice-kit-python $ src/assistant_grpc_demo.py

Сега кажете „Добре, Google“или натиснете този бутон и вижте дали работи!

Следващата страница ще ви помогне, ако имате собствен персонализиран файл и подходящите скорости на битове и проби за вашия.wav файл

Стъпка 5: Стъпка 5: Създайте свой собствен.wav файл

Стъпка 5: Създайте свой собствен.wav файл
Стъпка 5: Създайте свой собствен.wav файл

Ако не се интересувате от използването на моя.wav файл на стандартния начален звук на Google Home, ще трябва да създадете свой собствен.wav файл. Отне малко опити и грешки, за да накара правилния бит и честота на извадката да работят за мен.

Използвах Logic Pro X, за да направя цялото си редактиране (на снимката), което е пълноценна DAW за създаване и продуциране на музика. Две опции, които открих, които биха могли да бъдат подходящи, са Switch или MediaHuman Audio Converter. Предполагам, че бихте могли да направите това с Garageband, ако имате Mac, но не съм го пробвал.

Има три ключови части от вашия файл, които са му необходими, за да работи с демонстрационния код.

  1. Трябва да е MONO аудио файл
  2. Пробната честота трябва да бъде 32000
  3. Трябва да е.wav файл
  4. (По избор) 16 -битовата разделителна способност ми се отрази най -добре

Стъпка 6: Стъпка 6: Добавяне на звука за потвърждение?

Тук съм заседнал, ако някой има мисли. Бих искал да добавя шум за потвърждение, ако системата разпознае гласовото въвеждане като в нормален Google Home.

Прилагам шума за потвърждение на запасите по -долу за ваше удобство.

Наслади се!

Препоръчано: