Conversa amb robot. Combinació TTS i reconeixement de veu

De wikijoan
Salta a la navegació Salta a la cerca

Tota la part de reconeixement de la parla està documentada a CMU_Sphinx. La part de TTS amb espeak està documentada a una altra banda.

L'objectiu és desenvolupar un model de llenguatge i model acústic molt limitat (i que funcioni molt bé) per tal de què un nen pugui mantenir una conversa amb un robot. La conversa seria del tipus:

R-Hola, com et dius?
M-Maria
R-Quants anys tens?
M-sis anys
(aquí hi ha la possibilitat de detectar varis anys)
R-Si tens sis anys t'he d'estirar 6 vegades les orelles. Vols que te les estiri?
M-Si
si diu que sí:
R-Doncs no puc estirar-te-les perquè no tinc mans. Si vols passar hauràs d'endevinar aquesta endevinalla. Escolta bé.
si diu que no:
M-No
R-Aleshores si vols passar hauràs d'endevinar aquesta endevinalla. Escolta bé.
aquí hi ha vàries possibilitats d'endevinalles:
R-Transparenta però es veu,
amb les mans no la podràs agafar
perquè tard o d'hora s'escolarà.
M-L'aigua
R-Molt bé, ja pots passar.

Endevinalles infantils:

  • Tan gran com un camí i cap en un pot petit. Què és? El fil
  • Dos anells t'has de posar si vols fer-me treballar. Les tisores
  • Una capseta blanca, que quan s'obre ja no es tanca. Què és? L'ou
  • De dotze germans que en som sóc el segon i en canvi, sóc el més petit de tots. El febrer

La instal.lació constaria d'un ordinador portàtil que estaria amagat, un altaveu al que se li dibuixarien un ulls i boca, i un micro amb peu de micro. El nen, quan entra a casa, no pot passar perquè necessita una contrasenya.


creat per Joan Quintana Compte, novembre 2011