Sophie

Sophie

distrib > Mandriva > 2010.0 > i586 > media > contrib-release > by-pkgid > e74e806c1a2640e922856d7eb69d1420 > files > 108

howto-text-ja-2006-5mdv2010.0.noarch.rpm

Speech Recognition HOWTO

Stephen Cook

                scook@gear21.com
            

•ž•”‚Ž‘ - “ú–{Œê–ó

    htakashi@yabumi.com
  

Revision History                                                        
Revision v1.2        February 5, 2002                                   
Added more commercial software listings (sent by Mayur Patel).          
Revision v1.1        October 5, 2001             Revised by: scc        
Added info for Vocalis Speechware. Fixed/Updated various other items.   
Revision v1.0        November 20, 2000           Revised by: scc        
Added info on L and H and HTK                                           
Revision v0.5        September 13, 2000          Revised by: scc        
Initial HOWTO Submission                                                

Linux ã‚Å‚ÌŽ©“®‰¹º”FŽ¯ (ASR) ‚ªŠÈ’P‚É‚È‚è‚‚‚ ‚è‚Ü‚·. ŠJ”­ŽÒ‚¾‚¯‚Å‚È
‚­ƒ†[ƒU‚Å‚à“üŽè‰Â”\‚È‚à‚Ì‚à‚ ‚è‚Ü‚·. ‚±‚Ì•¶‘‚Å‚Í, ‰¹º”FŽ¯‚ÌŠî‘b‚Æ‚»
‚ê‚ç“üŽè‰Â”\‚ȃ\ƒtƒgƒEƒFƒA‚ɂ‚¢‚Ä‹Lq‚µ‚Ü‚·.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

Table of Contents
1. –@“I‚È’ˆÓ
   
    1.1. ’˜ìŒ /ƒ‰ƒCƒZƒ“ƒX
    1.2. –ƐÓ
    1.3. ¤•W
   
2. ‘O’u‚«
   
    2.1.  
    2.2. ŽÓŽ«
    2.3. ƒRƒƒ“ƒg/ÅVî•ñ/ƒtƒB[ƒhƒoƒbƒN
    2.4. ToDo
    2.5. ‰ü’ù—š—ð
   
3. ‚Í‚¶‚ß‚É
   
    3.1. ‰¹º”FŽ¯‚ÌŠî‘b
    3.2. ‰¹º”FŽ¯‚̃^ƒCƒv
    3.3. —˜—p–@‚Ɖž—p
   
4. ƒn[ƒhƒEƒFƒA
   
    4.1. ƒTƒEƒ“ƒhƒJ[ƒh
    4.2. ƒ}ƒCƒN
    4.3. ƒRƒ“ƒsƒ…[ƒ^/ƒvƒƒZƒbƒT
   
5. ‰¹º”FŽ¯ƒ\ƒtƒgƒEƒFƒA
   
    5.1. ƒtƒŠ[ƒ\ƒtƒgƒEƒFƒA
       
        5.1.1. XVoice
        5.1.2. CVoiceControl/kVoiceControl
        5.1.3. Open Mind Speech
        5.1.4. GVoice
        5.1.5. ISIP
        5.1.6. CMU Sphinx
        5.1.7. Ears
        5.1.8. NICO ANN Toolkit
        5.1.9. Myers' Hidden Markov Model Software
        5.1.10. Jialong He's Speech Recognition Research Tool
        5.1.11. ‚Ü‚¾‘¼‚É‚à‚ ‚è‚Ü‚·‚©?
       
    5.2. ¤—pƒ\ƒtƒgƒEƒFƒA
       
        5.2.1. IBM ViaVoice
        5.2.2. Vocalis Speechware
        5.2.3. Babel Technologies
        5.2.4. SpeechWorks
        5.2.5. Nuance
        5.2.6. Abbot/AbbotDemo
        5.2.7. Entropic
        5.2.8. ‘¼‚̏¤—p»•i
       
6. ‰¹º”FŽ¯‚Ì“à‘¤
   
    6.1. ‚ǂ̂悤‚É”FŽ¯‚µ‚Ä‚¢‚é‚©
    6.2. ƒfƒBƒWƒ^ƒ‹ƒI[ƒfƒBƒI‚ÌŠî‘b
   
7. o”Å•¨
   
    7.1. ‘Ð
    7.2. ƒCƒ“ƒ^[ƒlƒbƒg
   
8. “ú–{Œê–ó‚ɂ‚¢‚Ä

1. –@“I‚È’ˆÓ

1.1. ’˜ìŒ /ƒ‰ƒCƒZƒ“ƒX

(–ó’: Œ´•¶‚ðŽc‚µ‚Ü‚·.)

This document is copyrighted (c) 2000-2002 Stephen C. Cook.

LICENSE: This document may be reproduced and distributed in whole or in
part, in any medium physical or electronic, provided that this license
notice is displayed in the reproduction. Commercial redistribution is
permitted and encouraged. Thirty days advance notice, via email to the
author, of redistribution is appreciated, to give the author time to
provide updated documents.

ƒ‰ƒCƒZƒ“ƒX: ‚±‚̃‰ƒCƒZƒ“ƒXŽ–€‚ª‚»‚Ì’†‚É•\Ž¦‚³‚ê‚Ä‚¢‚éŒÀ‚è, ‚±‚Ì•¶‘‚Ì
ˆê•”‚Ü‚½‚Í‘S•”‚ð, •¨—“I‚ ‚é‚¢‚Í“dŽq“I‚È‚ ‚ç‚ä‚é”}‘̂ŏC³‚µ, •¡»‚·‚é
‚±‚Æ‚ª‚Å‚«‚Ü‚·. ¤“I‚ȍĔz•z‚à‹–‰Â, „§‚³‚ê‚Ä‚¢‚Ü‚·. 30“ú‘O‚à‚Á‚Ä, ì
ŽÒ‚É Email ‚ð’Ê‚¶‚Ä, Ä”z•z‚Ì’Ê’m‚ð‚­‚ê‚é‚Æ‚¤‚ꂵ‚¢‚Å‚·, ìŽÒ‚ɍŐV‚Ì•¶
‘‚ð—pˆÓ‚·‚鎞ŠÔ‚ð‰º‚³‚¢.

All modified documents, including translations, anthologies, and
partial documents, must meet the following requirements:

–|–ó‚âƒAƒ“ƒ\ƒƒW[, •¶‘‚̈ꕔ‚ðŠÜ‚ß‚Ä, ‘S‚Ă̏C³‚³‚ꂽ•¶‘‚͈ȉº‚̏ð
Œ‚ð–ž‘«‚µ‚È‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ:

 E Modified versions must be labeled as such.
   
    C³‚³‚ꂽ”Å‚Í‚»‚ÌŽ|‚ªŽ¦‚³‚ê‚Ä‚¢‚È‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ.
   
 E The person making the modifications must be identified.
   
    C³‚ðs‚È‚Á‚½l‚ª“Á’肳‚ê‚Ä‚¢‚È‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ.
   
 E Acknowledgement of the original author must be retained.
   
    ƒIƒŠƒWƒiƒ‹‚Ì’˜ŽÒ‚̏³”F‚ª•Û‚½‚ê‚Ä‚¢‚È‚¢‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ
   
 E The location of the original unmodified document be identified.
   
    ƒIƒŠƒWƒiƒ‹‚̕ύX‘O‚Ì•¶‘‚̏ꏊ‚ª“Á’肳‚ê‚Ä‚¢‚È‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ.
   
 E The original author's name(s) may not be used to assert or imply
    endorsement of the resulting document without the original author's
    permission.
   
    Œ´’˜ŽÒ‚Ì‹–‰Â–³‚­, Œ´’˜ŽÒ‚Ì–¼‘O‚ðŽg‚Á‚Ä, Œ‹‰Ê‚Ì•¶‘‚ÌŠm”F‚ðŽå’£‚µ‚½
    ‚èˆÃŽ¦‚µ‚½‚肵‚È‚¢‚ʼnº‚³‚¢.
   
 E The author be notified by email of the modification in advance of
    redistribution.
   
    Ä”z•z‚Ì‘O‚É, C³‚ɂ‚¢‚Ä’˜ŽÒ‚É email ‚Å’Ê’m‚µ‚Ä‚­‚¾‚³‚¢.
   
 E As a special exception, anthologies of LDP documents may include a
    single copy of these license terms in a conspicuous location within
    the anthology and replace other copies of this license with a
    reference to the single copy of the license without the document
    being considered "modified" for the purposes of this section.
   
    “Á•Ê‚È—áŠO‚Æ‚µ‚Ä, LDP ‚Ì•¶‘‚̃Aƒ“ƒ\ƒƒW[‚Í, ‚±‚ê‚ç‚̃‰ƒCƒZƒ“ƒXð
    €‚Ì’Pˆê‚̃Rƒs[‚ðƒAƒ“ƒ\ƒƒW[‚Ì“à‚Ì–Ú—§‚ꏊ‚ÉŠÜ‚Ý, ‚±‚̃‰ƒCƒZƒ“
    ƒX‚Ì‘¼‚̃Rƒs[‚ð, ‚»‚Ì’Pˆê‚̃‰ƒCƒZƒ“ƒX‚̃Rƒs[‚Ö‚ÌŽQÆ‚ÅŠ·‚¦‚邱‚Æ
    ‚ª‚ ‚è‚Ü‚·. ‚±‚̏ꍇ‚Í–{ß‚Ì–Ú“I‚©‚ç‚͕ύX‚ÆŒ©‚È‚³‚ê‚Ü‚¹‚ñ.
   
Mere aggregation of LDP documents with other documents or programs on
the same media shall not cause this license to apply to those other
works.

“¯‚¶ƒƒfƒBƒAã‚Å‘¼‚Ì•¶‘‚âƒvƒƒOƒ‰ƒ€‚ðW‚ß‚½ LDP •¶‘‚Ì’P‚È‚éW‡‘Ì‚Í,
‚»‚ê‚ç‚Ì‘¼‚̍ì•i‚É‚±‚̃‰ƒCƒZƒ“ƒX‚ð“K—p‚·‚邱‚Æ‚Í‚ ‚è‚Ü‚¹‚ñ.

All translations, derivative documents, or modified documents that
incorporate this document may not have more restrictive license terms
than these, except that you may require distributors to make the
resulting document available in source format.

”z•zŽÒ‚ɐ¶¬•¨‚Ì•¶‘‚ðƒ\[ƒX‚ÌŒ`Ž®‚Å“üŽè‚Å‚«‚é‚悤‚É‹‚ß‚éê‡‚ðœ‚¢‚Ä,
‘S‚Ä‚Ì–|–ó, ”h¶‚µ‚½•¶‘, ‚ ‚é‚¢‚Í‚±‚Ì•¶‘‚ð‘g‚ݍž‚ñ‚ŏC³‚³‚ꂽ•¶‘‚Í
‚±‚êˆÈãŒµ‚µ‚¢ƒ‰ƒCƒZƒ“ƒXŽ–€‚ðŽ‚½‚¹‚Ä‚Í‚¢‚¯‚Ü‚¹‚ñ.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

1.2. –ƐÓ

(–ó’: Œ´•¶‚ðŽc‚µ‚Ü‚·.)

The author disclaims all warranties with regard to this document,
including all implied warranties of merchantability and fitness for a
certain purpose; in no event shall the author be liable for any
special, indirect or consequential damages or any damages whatsoever
resulting from loss of use, data or profits, whether in an action of
contract, negligence or other tortious action, arising out of or in
connection with the use of this document.

’˜ŽÒ‚Í, ‘S‚Ă̏¤sˆ×‚ª‰Â”\‚Å‚ ‚邱‚Ƃ̈Öق̕ۏØ, ‚ ‚é–Ú“I‚Ö“K‡‚·‚邱
‚Æ‚ðŠÜ‚ß‚Ä‚±‚Ì•¶‘‚ÉŠÖ‚·‚é‘S‚Ă̕ۏ؂ð•úŠü‚µ‚Ü‚·; ‚ǂ̂悤‚ȏo—ˆŽ–‚ª‚ 
‚Á‚Ä‚à, ‚±‚Ì•¶‘‚ÌŽg—p‚Æ‚ÌŒp‚ª‚è‚Ì“àŠO‚Å‹N‚±‚é, ‹K–ñ‚Ì’†‚ÌŠˆ“®, ‘Ó–‚ 
‚é‚¢‚Í‘¼‚Ì•s–@sˆ×‚É‚æ‚é‚à‚Ì‚Å‚ ‚낤‚Æ, ‚ ‚ç‚ä‚é“Á•Ê‚È, ŠÔÚ“I‚Ü‚½‚Í,
Œ‹‰Ê“I‚È‘¹ŠQ‚âŽg—p, ƒf[ƒ^, —˜‰v‚Ì‘¹Ž¸‚É‚æ‚鑹ŠQ‚Ȃǂɑ΂µ‚čìŽÒ‚͐ӔC
‚𕉂¢‚Ü‚¹‚ñ.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

1.3. ¤•W

‚±‚Ì•¶‘‚ÉŠÜ‚Ü‚ê‚é‘S‚Ă̏¤•W‚Í‚»‚ꂼ‚ê‚̏Š—LŽÒ‚Ì’˜ìŒ /“o˜^¤•W‚Å‚·.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

2. ‘O’u‚«

2.1.

‚±‚Ì•¶‘‚͉¹º”FŽ¯‚ÌŠwK‹»–¡‚ª‚ ‚è, ŽŽ‚µ‚Ă݂悤‚Æ‚µ‚Ä‚¢‚鏉‹‰‚©‚ç’†‹‰
ƒŒƒxƒ‹‚Ì Linux ƒ†[ƒU‚ðƒ^[ƒQƒbƒg‚É‚µ‚Ä‚¢‚Ü‚·. ‚Ü‚½, ‹»–¡‚ðŽ‚Á‚½ŠJ”­ŽÒ
‚Ì‚½‚߂ɉ¹º”FŽ¯‚ÉŠÖ‚·‚éƒvƒƒOƒ‰ƒ~ƒ“ƒO‚ÌŠî‘b‚ɂ‚¢‚Ä‚àà–¾‚µ‚Ü‚·.

‚ǂ̂悤‚ȉ¹º”FŽ¯ƒ\ƒtƒgƒEƒFƒA‚ÆŠJ”­—p‚̃‰ƒCƒuƒ‰ƒŠ‚ª Linux ‚ÅŽg—p‚Å‚«‚é
‚Ì‚©‚𒲂׎n‚ß‚½‚Æ‚«‚É‚±‚Ì•¶‘‚ð‘‚«‚Í‚¶‚ß‚Ü‚µ‚½. Linux ã‚Å‚ÌŽ©“®‰¹º
”FŽ¯ (ASR ‚Ü‚½‚Í’P‚É SR) ‚Í‚¿‚傤‚Ç–{—Ì‚ð”­Šö‚µ‚Í‚¶‚ß‚½‚±‚Æ‚ë‚Å, ‚±‚Ì•¶
‘‚Ő³‚µ‚¢•ûŒü‚֌㉟‚µ‚Å‚«‚邱‚Æ‚ðŠè‚Á‚Ä‚¢‚Ü‚· - ASR ‹Zp‚̃†[ƒU‚ÆŠJ”­
ŽÒ‚Ì—¼•û‚ðƒTƒ|[ƒg‚·‚邱‚Æ‚Å.  

‚±‚Ì•¶‘‚Í SR ‚Ì‹Zp‚ɂ‚¢‚Ă͐G‚ê‚Ä‚¢‚Ü‚¹‚ñ, ‚»‚Ì‘ã‚è‚É "HOWTO" ‚Æ‚¢‚¤
‘¤–ʂɏW’†‚µ‚Ä‚¢‚Ü‚· (‚±‚ê‚Í HOWTO ‚Å‚·‚©‚çc). ‚±‚±‚ŃJƒo[‚Å‚«‚Ä‚¢‚È
‚¢‚±‚Ƃɂ‚¢‚Ä‚Í, ‹»–¡‚ðŽ‚Á‚½“ÇŽÒ‚ª–{‚â‹LŽ–‚ð’T‚¹‚é‚悤‚ɏo”Å•¨‚̐߂ð
—pˆÓ‚µ‚Ü‚µ‚½. ‚±‚ꂪLinux ã‚Ì ASR ‚ɂ‚¢‚Ă̍ŏI“I‚È•ñ‚Æ‚¢‚¤‚±‚Æ‚Å‚Í
‚ ‚è‚Ü‚¹‚ñ.

‚±‚Ì•¶‘‚̍ŐV”Å‚Í, LDP ‚̃A[ƒJƒCƒu‚ðƒ`ƒFƒbƒN‚·‚é‚©, http://
www.gear21.com/speech/index.html‚©‚ç“üŽè‚µ‚Ä‚­‚¾‚³‚¢.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

2.2. ŽÓŽ«

‚±‚Ì•¶‘‚ðŒ©’¼‚µ, ‰‡•‚µ‚Ä‚­‚¾‚³‚Á‚½ˆÈ‰º‚̐lX‚ÉŠ´ŽÓ‚µ‚Ü‚·:

 E Jessica Perry Hekman
   
 E Geoff Wexler
   
„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

2.3. ƒRƒƒ“ƒg/ÅVî•ñ/ƒtƒB[ƒhƒoƒbƒN

ƒRƒƒ“ƒg‚â, ’ñˆÄ, ‰ü’ù, ÅVî•ñ‚ª‚ ‚ê‚Î, ‚Ü‚½, ‚½‚¾ ASR ‚ɂ‚¢‚ă`ƒƒƒb
ƒg‚µ‚½‚¢‚Æ‚«‚à, Ž„‚̃AƒhƒŒƒX scook@gear21.com <mailto:scook@gear21.com>
‚É Email ‚ð‰º‚³‚¢.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

2.4. ToDo

ˆÈ‰º‚Ì‚±‚Æ‚ª "to do" ‚Æ‚µ‚ÄŽc‚Á‚Ä‚¢‚Ü‚·:

 E o”Å•¨‚Ìß‚Éà–¾‚ð‰Á‚¦‚é.
   
 E o”Å•¨‚̐߂ɂæ‚葽‚­‚Ì–{‚ð‰Á‚¦‚é.
   
 E ‚æ‚葽‚­‚̃Šƒ“ƒN‚ðà–¾•t‚«‚ʼnÁ‚¦‚é.
   
 E ASR ƒVƒXƒeƒ€‚̎菇‚ɂ‚¢‚Ä‚Ìà–¾‚ð[ŽÀ‚³‚¹‚é.
   
 E FFT ‚ƃtƒBƒ‹ƒ^[‚Ìà–¾‚ð‰Á‚¦‚é.
   
 E DSP ‚ÌŒ´—‚Ìà–¾‚ð‰Á‚¦‚é.
   
„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

2.5. ‰ü’ù—š—ð

v0.1 Å‰‚Ì‘ˆÄ 2000”N 8ŒŽ

v0.5 ÅI‘ˆÄ 2000”N 9ŒŽ

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

3. ‚Í‚¶‚ß‚É

3.1. ‰¹º”FŽ¯‚ÌŠî‘b

‰¹º”FŽ¯‚Æ‚Í, ƒRƒ“ƒsƒ…[ƒ^ (‚ ‚é‚¢‚Í‘¼‚̃^ƒCƒv‚Ì‹@ŠB) ‚ª˜b‚µŒ¾—t‚ð”FŽ¯
‚·‚鏈—‚Å‚·. Šî–{“I‚É‚Í, ƒRƒ“ƒsƒ…[ƒ^‚ÉŒü‚Á‚Ęb‚µ, ‚»‚ÌŒ¾—t‚ªƒRƒ“ƒsƒ…
[ƒ^‚ɐ³‚µ‚­”FŽ¯‚³‚ê‚é‚Æ‚¢‚¤ˆÓ–¡‚Å‚·.

ˆÈ‰º‚Ì’è‹`‚͉¹º”FŽ¯‚Ì‹Zp‚ð—‰ð‚·‚é‚½‚ß‚É•K—v‚ÈŠî‘b‚Å‚·.

”­˜b
   
    ”­˜b‚Í, 1‚‚̈Ӗ¡‚ð•\‚·’PŒê‚â‚¢‚­‚‚©‚ÌŒ¾—t‚ðƒRƒ“ƒsƒ…[ƒ^‚ÉŒü‚©‚Á‚Ä
    ”­º‚·‚é (˜b‚·) ‚±‚Æ‚Å‚·. ”­˜b‚Í’PŒê‚Å‚ ‚Á‚½‚è, Œ¾—t‚Å‚ ‚Á‚½‚è, •¶
    ‚Å‚ ‚Á‚½‚è, ‚ ‚é‚¢‚Í•¡”‚Ì•¶‚Å‚ ‚Á‚½‚肵‚Ü‚·.
   
˜bŽÒ‚ւ̈ˑ¶
   
    ˜bŽÒ‚Ɉˑ¶‚·‚éƒVƒXƒeƒ€‚Í“Á’è‚̘bŽÒ‚ð‘ΏۂƂµ‚Đ݌v‚³‚ê‚Ü‚·. ‚»‚̃V
    ƒXƒeƒ€‚͈ê”Ê‚É, ‚»‚Ì“Á’è‚̘bŽÒ‚Ì”­º‚ɑ΂µ‚Ă͐³Šm‚Å‚·‚ª, ‘¼‚̘bŽÒ
    ‚ł͐¸“x‚ª‚¸‚Á‚ƈ«‚­‚È‚è‚Ü‚·. ‚»‚ê‚ç‚͘bŽÒ‚ªˆê’è‚̐º‚Æ‘¬“x‚Řb‚·‚±
    ‚Æ‚ð‰¼’è‚µ‚Ä‚¢‚Ü‚·. ˜bŽÒ‚Ɉˑ¶‚µ‚È‚¢ƒVƒXƒeƒ€‚Í—lX‚ȘbŽÒ‚ÉŒü‚¯‚ĐÝ
    Œv‚³‚ê‚Ü‚·. ‡‰ž«‚Ì‚ ‚éƒVƒXƒeƒ€‚Í•’Ê, ˜bŽÒ‚Ɉˑ¶‚µ‚È‚¢ƒVƒXƒeƒ€‚Æ
    ‚µ‚ăXƒ^[ƒg‚µ, ŠwK‹Zp‚ð—˜—p‚µ‚Ä”FŽ¯¸“x‚ð‚‚ß‚é‚±‚ƂŘbŽÒ‚É“K‰ž
    ‚µ‚Ä‚¢‚«‚Ü‚·.
   
Œêœb
   
    Œêœb (‚ ‚é‚¢‚ÍŽ«‘) ‚Æ‚Í, SR ƒVƒXƒeƒ€‚É”FŽ¯‚³‚ê‚邽‚ß‚ÌŒ¾—t‚â”­˜b‚Ì
    ƒŠƒXƒg‚Å‚·. ˆê”Ê‚É, ƒRƒ“ƒsƒ…[ƒ^‚É‚Æ‚Á‚Ă͏­‚È‚¢Œêœb‚Ì‚Ù‚¤‚ª”FŽ¯‚µ
    ‚â‚·‚­, Œêœb‚ª‘½‚­‚È‚é‚Ù‚Ç”FŽ¯‚ª¢“ï‚É‚È‚è‚Ü‚·. •’Ê‚ÌŽ«‘‚Ƃ͈قÈ
    ‚è, ‚»‚ꂼ‚ê‚̍€–Ú‚Í’PŒê‚Å‚Í‚ ‚è‚Ü‚¹‚ñ. ‚»‚ê‚ç‚Í•¶‚╶Í‚Ù‚Ç’·‚­‚È
    ‚邱‚Æ‚à‚ ‚è‚Ü‚·. ­‚È‚¢Œêœb‚Í1‚‚©2‚‚̔FŽ¯‚³‚ꂽ•¶ (—Ⴆ‚Î "Wake
    up") ‚µ‚©‚È‚¢‚©‚à‚µ‚ê‚Ü‚¹‚ñ‚ª, ‚Æ‚Ä‚à‘½‚¢Œêœb‚Å‚Í 10 –œŒêˆÈã‚Æ‚È‚è
    ‚Ü‚·.
   
¸“x
   
    ”FŽ¯‘•’u‚Ì”\—Í‚Í‚»‚̐¸“x‚𑪒肷‚邱‚Æ‚É‚æ‚Á‚Ä, ‚ ‚é‚¢‚Í‚Ü‚½, ˜b‚³
    ‚ꂽŒ¾—t‚ð‚Ç‚ê‚­‚ç‚¢”FŽ¯‚·‚é‚©‚É‚æ‚Á‚Ä’²‚ׂ邱‚Æ‚ª‚Å‚«‚Ü‚·. ‚±‚ê‚Í
    ”­˜b‚𐳊m‚É“Á’è‚·‚邾‚¯‚Å‚È‚­, ”­˜b‚ªŒêœb‚ÉŠÜ‚Ü‚ê‚Ä‚¢‚é‚©‚Ç‚¤‚©‚ð
    “Á’è‚·‚邱‚Æ‚àŠÜ‚ñ‚Å‚¢‚Ü‚·. —Ç‚¢ ASR ƒVƒXƒeƒ€‚Í 98% ˆÈã‚̐¸“x‚ª‚ 
    ‚è‚Ü‚·. ‚ ‚éƒVƒXƒeƒ€‚̐¸“x‚Ì‹–—e”͈͂͂»‚Ì—p“r‚É‹­‚­ˆË‘¶‚µ‚Ü‚·.
   
ŠwK
   
    ˜bŽÒ‚ɏ‡‰ž‚·‚é”\—Í‚ðŽ‚Â‰¹º”FŽ¯‚à‚ ‚è‚Ü‚·. ƒVƒXƒeƒ€‚ª‚±‚Ì”\—Í‚ð‚à
    ‚Á‚Ä‚¢‚é‚Æ‚«‚Í, ŠwK‚³‚¹‚邱‚Æ‚ª‚Å‚«‚Ü‚·. ASR ƒVƒXƒeƒ€‚͘bŽÒ‚É•W€
    “I‚ÈŒ¾—t‚âˆê”Ê“I‚ÈŒ¾—t‚ðŒJ‚è•Ô‚³‚¹, ”äŠr‚̃Aƒ‹ƒSƒŠƒYƒ€‚ð“Á’è‚̘bŽÒ
    ‚É’²˜a‚·‚邱‚Æ‚ÅŠwK‚³‚ê‚Ü‚·. ˆê”Ê‚É”FŽ¯‘•’u‚ðŠwK‚³‚¹‚邱‚Æ‚Å, ‚»
    ‚̐¸“x‚ÍŒüã‚µ‚Ü‚·.
   
    ŠwK‚Í, ˜b‚µ•û‚â‚ ‚éŽí‚Ì’PŒê‚Ì”­‰¹‚ª‚¤‚Ü‚­‚Å‚«‚È‚¢˜bŽÒ‚É‚à—˜—p‚³‚ê
    ‚Ü‚·. ˜bŽÒ‚ªŽñ”öˆêŠÑ‚µ‚Ä”­˜b‚ðŒJ‚è•Ô‚·ŒÀ‚è, ŠwK‹@”\‚Ì‚ ‚é ASR ƒVƒX
    ƒeƒ€‚Í“K‰ž‚·‚邱‚Æ‚ª‰Â”\‚Å‚µ‚傤.
   
„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

3.2. ‰¹º”FŽ¯‚̃^ƒCƒv

‰¹º”FŽ¯‚̃VƒXƒeƒ€‚Í, ‚ǂ̂悤‚ȃ^ƒCƒv‚Ì”­˜b‚ð”FŽ¯‚·‚é”\—Í‚ðŽ‚Á‚Ä‚¢‚é
‚©‚É‚æ‚Á‚Ä, Šô‚‚©‚̃Nƒ‰ƒX‚É•ª—Þ‚·‚邱‚Æ‚ª‚Å‚«‚Ü‚·. ‚±‚̂悤‚ȃNƒ‰ƒX‚Í
˜bŽÒ‚ª‚¢‚”­˜b‚ðŽn‚ß, ‚¢‚I‚¦‚½‚Ì‚©‚𑪒肷‚é”\—Í‚ª ASR ‚̓‚³‚Ì 1‚Â
‚Å‚ ‚é‚Æ‚¢‚¤Ž–ŽÀ‚ÉŠî‚¢‚Ä‚¢‚Ü‚·. ‘½‚­‚̃pƒbƒP[ƒW‚ªŽg—p’†‚̃‚[ƒh‚É‚æ
‚Á‚Ä, •¡”‚̃Nƒ‰ƒX‚É“K‡‚µ‚Ü‚·.

ŒÇ—§‚µ‚½Œ¾—t
   
    ŒÇ—§‚µ‚½Œ¾—t‚Ì”FŽ¯‚É‚Í, ‚»‚ꂼ‚ê‚Ì”­˜b‚²‚ƂɃTƒ“ƒvƒ‹ƒEƒBƒ“ƒhƒE (ƒT
    ƒ“ƒvƒ‹‚ÌŠJŽn‚©‚çI—¹‚ÌŠúŠÔ)‚Ì‘OŒã‚ɉ¹‚Ì‚È‚¢ŽžŠÔ (ƒI[ƒfƒBƒIM†‚Ì–³
    ‚¢ó‘Ô)‚ª•K—v‚Æ‚È‚è‚Ü‚·. ”FŽ¯‘•’u‚ª’PŒê‚ðŽó‚¯Žæ‚é‚Æ‚¢‚¤‚킯‚Å‚È‚­ˆê
    “x‚É‚Í”­˜b‚͈ê‚‚Ƃ¢‚¤ˆÓ–¡‚Å‚·. ‚±‚̃VƒXƒeƒ€‚Å‚Í•’Ê‚È‚Ì‚Å‚·‚ª,
    ``‰¹º“ü—͏ó‘Ô / ”FŽ¯ó‘Ô'' ‚Æ‚¢‚¤ 2 ‚‚̏ó‘Ô‚ª‚ ‚邽‚߁C˜bŽÒ‚Í‚Æ‚¬
    ‚ê‚Æ‚¬‚ê‚ɘb‚³‚È‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ (º‚ª‚Æ‚¬‚ꂽ‚Æ‚«‚É”FŽ¯ˆ—‚ð‚µ‚Ä
    ‚¢‚Ü‚·). ŒÇ—§‚µ‚½”­˜b‚Í‚±‚̃Nƒ‰ƒX‚Å‚Í‚æ‚è—Ç‚¢–¼‘O‚©‚à‚µ‚ê‚Ü‚¹‚ñ.
   
˜A‘±‚µ‚½Œ¾—t
   
    ˜A‘±‚µ‚½Œ¾—t (‚ ‚é‚¢‚Í‚æ‚萳Šm‚É '˜A‘±‚µ‚½”­˜b') ‚̃VƒXƒeƒ€‚͌Ǘ§‚µ
    ‚½Œ¾—t‚̃VƒXƒeƒ€‚ÉŽ—‚Ä‚¢‚Ü‚·‚ª, ŠÔ‚ɍŒZ‚Ì‹xŽ~‚ð‚Í‚³‚Ý‚È‚ª‚ç '‘±‚¯
    ‚Ä”­º‚³‚ê‚é' ŒÂ•Ê‚Ì”­˜b‚ð”FŽ¯‚µ‚Ü‚·.
   
˜A‘±‚µ‚½‰¹º
   
    ˜A‘±‚µ‚½”FŽ¯‚ªŽŸ‚̃Xƒeƒbƒv‚Å‚·. ˜A‘±‚µ‚½‰¹º‚ð”FŽ¯‚Å‚«‚é‘•’u‚͍łà
    ì‚è‚É‚­‚¢‚à‚Ì‚Å‚·, ‚È‚º‚È‚ç”­˜b‚Ì‹«ŠE‚ð“Á’è‚·‚邽‚ß‚É“ÁŽê‚È•û–@‚ð
    Žg—p‚µ‚È‚¯‚ê‚΂Ȃç‚È‚¢‚©‚ç‚Å‚·. ˜A‘±‚µ‚½‰¹º”FŽ¯‘•’u‚̓†[ƒU‚É‚Ù‚Æ
    ‚ñ‚ÇŽ©‘R‚ɘb‚·‚±‚Æ‚ð‹–‚µ‚Ü‚·, ˆê•û‚ŃRƒ“ƒsƒ…[ƒ^‚ª“à—e‚ð“Á’肵‚Ü‚·.
    Šî–{“I‚É, ‚»‚ê‚̓Rƒ“ƒsƒ…[ƒ^‚̏‘‚«Žæ‚è‚Å‚·.
   
Ž©‘R‚ȉ¹º
   
    ŽÀÛ‚ÉŽ©‘R‚ȉ¹º‚ª‰½‚Å‚ ‚é‚©‚Ì’è‹`‚Í‚³‚Ü‚´‚Ü‚ ‚é‚悤‚Å‚·. Šî–{“I‚È
    ’iŠK‚Å‚Í, ‚»‚ê‚ÍŽ©‘R‚ȉ¹‚Ì”­¶‚Å‚ ‚Á‚ÄŒJ‚è•Ô‚³‚ê‚é‚à‚Ì‚Å‚Í‚È‚¢‚Æ‚¢
    ‚¤l‚¦‚Å‚ ‚é‚©‚à‚µ‚ê‚Ü‚¹‚ñ. Ž©‘R‚ȉ¹º‚Ì‹@”\‚ð”õ‚¦‚½ ASR ƒVƒXƒeƒ€‚Í
    "ums" ‚Æ "ahs" ‚È‚Ç, ¬‡‚³‚ꂽŒ¾—t‚È‚Ç‚Ì‚³‚Ü‚´‚Ü‚ÈŽ©‘R‚̉¹º‚Ì“Á’¥
    ‚â, ”÷‚©‚ÈŒû‚²‚à‚肳‚¦, ˆµ‚¤‚±‚Æ‚ª‰Â”\‚Å‚µ‚傤.
   
‰¹ºÆ‡/Ž¯•Ê
   
    ‚¢‚­‚‚©‚Ì ASR ƒVƒXƒeƒ€‚Í“Á’è‚̃†[ƒU‚ðŽ¯•Ê‚·‚é‹@”\‚ðŽ‚Á‚Ä‚¢‚Ü‚·.
    ‚±‚Ì•¶‘‚ł͏ƍ‡‚âƒZƒLƒ…ƒŠƒeƒB‚Ì‚½‚߂̃VƒXƒeƒ€‚ɂ‚¢‚Ă͈µ‚¢‚Ü‚¹‚ñ.
   
„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

3.3. —˜—p–@‚Ɖž—p

ƒRƒ“ƒsƒ…[ƒ^‚ƐlŠÔ‚𒇉‚éŽdŽ–‘S”Ê‚É‚¨‚¢‚Ä, ASR ‚̏o”Ô‚ª‚ ‚é‚©‚à‚µ‚ê
‚Ü‚¹‚ñ. Œ»Ý‚͉º‹L‚É‹“‚°‚½ƒAƒvƒŠƒP[ƒVƒ‡ƒ“‚ªˆê”Ê“I‚Å‚·.

‘‚«Žæ‚è
   
    ‘‚«Žæ‚è‚Í, ¡“úÅ‚àˆê”Ê“I‚È ASR ƒVƒXƒeƒ€‚ÌŽg—p–@‚Å‚·. ‚±‚ê‚͈ê”Ê‚Ì
    •¶‘ˆ—‚Æ“¯—l‚ɈãŠw‹L˜^“]ŽÊ‚â, –@—¥‚âŽdŽ–‚̏‘‚«Žæ‚è‚àŠÜ‚Ý‚Ü‚·. ƒV
    ƒXƒeƒ€‚̐¸“x‚ðŒüã‚³‚¹‚邽‚ß‚É, “Á•Ê‚ÈŒêœb‚ªŽg‚í‚ê‚éê‡‚à‚ ‚è‚Ü‚·.
   
‰¹º–½—߃VƒXƒeƒ€
   
    ƒRƒ“ƒsƒ…[ƒ^‚̃Rƒ}ƒ“ƒh‚ðŽÀs‚·‚é ASR ƒVƒXƒeƒ€‚Ì‚±‚Æ‚ð, ‰¹º–½—߃VƒX
    ƒeƒ€‚Æ’è‹`‚µ‚Ü‚·. "Open Netscape" ‚â "Start a new xterm" ‚̂悤‚ɉ¹
    º‚Å–½—ß‚·‚é‚Æ, ”­˜b‚Ç‚¨‚è‚̃Rƒ}ƒ“ƒh‚ªŽÀs‚³‚ê‚Ü‚·.
   
“d˜b
   
    ‚¢‚­‚‚©‚Ì PBX/Voice ƒ[ƒ‹ƒVƒXƒeƒ€‚Í, ƒ{ƒ^ƒ“‚ð‰Ÿ‚·‚©‚í‚è‚ɃRƒ}ƒ“ƒh
    ‚ð˜b‚·‚±‚Æ‚Å“d˜b‚ð‚©‚¯‚ç‚ê‚Ü‚·.
   
Œg‘Ñ‹@Ší
   
    “ü—ÍŽè’i‚ªŒÀ’肳‚ê‚Ä‚¢‚éŒg‘Ñ‹@Ší‚Å‚Í, ˜b‚·‚±‚Æ‚Í“–‘R‰Â”\‚Å‚·.
   
ˆã—Ã/ƒnƒ“ƒfƒBƒLƒƒƒbƒv
   
    ‘½‚­‚̐l‚ª, ”½•œ‰^“®‰ß‘½‘¹ (RSI), ‹ØƒWƒXƒgƒƒtƒB[‚Ȃǂ̂悤‚Ȑg
    ‘Ì“I‚Ȑ§ŒÀ‚Ì‚½‚߂Ƀ^ƒCƒsƒ“ƒO‚É–â‘è‚ð•ø‚¦‚Ä‚¢‚Ü‚·. —Ⴆ‚Î’®Šo‚É–â‘è
    ‚Ì‚ ‚él‚Í, ‘ŠŽè‚̐º‚ðƒeƒLƒXƒg‚É•Ï‚¦‚邽‚ß‚É“d˜b‚ɐڑ±‚³‚ꂽƒVƒXƒe
    ƒ€‚ðŽg—p‚Å‚«‚é‚Å‚µ‚傤.
   
‘g‚ݍž‚݃AƒvƒŠƒP[ƒVƒ‡ƒ“
   
    V‚µ‚¢Œg‘Ñ“d˜b‚Ì‚È‚©‚É‚Í "Call Home" ‚̂悤‚È”­˜b‚ð‰ðŽß‚·‚é C&C ‰¹
    º”FŽ¯‚ð”õ‚¦‚½‚à‚Ì‚à‚ ‚è‚Ü‚·. ‚±‚ê‚͏«—ˆ‚Ì ASR ‚Æ Linux ‚ÌŽå—vŽ–€
    ‚Æ‚È‚é‚©‚à‚µ‚ê‚Ü‚¹‚ñ. ‚È‚ºŽ„‚Í‚Ü‚¾ƒeƒŒƒr‚ɘb‚µ‚©‚¯‚ç‚ê‚È‚¢‚Ì‚Å‚µ‚å
    ‚¤‚©?
   
„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

4. ƒn[ƒhƒEƒFƒA

4.1. ƒTƒEƒ“ƒhƒJ[ƒh

‰¹º‚Í”äŠr“I’á‚¢‘ш敝‚ð•K—v‚Æ‚·‚é‚Ì‚Å, ’†’ö“x‚©‚獂•iŽ¿‚Ì 16 ƒrƒbƒgƒT
ƒEƒ“ƒhƒJ[ƒh‚È‚çŽg‚¦‚é‚Å‚µ‚傤. ƒJ[ƒlƒ‹‚ŃTƒEƒ“ƒh‚ð—LŒø‚É‚µ‚Đ³‚µ‚¢ƒh
ƒ‰ƒCƒo‚ðƒCƒ“ƒXƒg[ƒ‹‚µ‚È‚¯‚ê‚΂Ȃè‚Ü‚¹‚ñ. ƒTƒEƒ“ƒhƒJ[ƒh‚ɂ‚¢‚Ä‚Ì‚±‚ê
ˆÈã‚̏î•ñ‚Í http://www.LinuxDoc.org/ ‚É‚ ‚é "The Linux Sound HOWTO" ‚ð
Œ©‚Ä‚­‚¾‚³‚¢. ƒTƒEƒ“ƒhƒJ[ƒh‚Ì•iŽ¿‚ɂ‚¢‚Ă͐¸“x‚ƃmƒCƒY‚̉e‹¿‚ɂ‚¢‚Ä,
‚µ‚΂µ‚΋c˜_‚ª‚Ü‚«‹N‚±‚è‚Ü‚·.

Å‚àãY—í‚È A/D (ƒAƒiƒƒO‚©‚çƒfƒBƒWƒ^ƒ‹) ‚Ö‚Ì•ÏŠ·‹@”\‚ðŽ‚Á‚½ƒTƒEƒ“ƒhƒJ
[ƒh‚ðŠ©‚ß‚Ü‚·‚ª, ‚µ‚΂µ‚΃fƒBƒWƒ^ƒ‹ƒTƒ“ƒvƒ‹‚Ì–¾—Ä‚³‚̓}ƒCƒN‚̐«”\‚ɈË
‘¶‚µ, ŽüˆÍ‚̃mƒCƒY‚É‚Í‚¢‚Á‚»‚¤‘å‚«‚­ˆË‘¶‚µ‚Ü‚·. ƒ‚ƒjƒ^‚â, PCI ƒXƒƒbƒg,
ƒn[ƒhƒfƒBƒXƒN‚È‚Ç‚©‚ç‚Ì“d‹CM†“I‚ȃmƒCƒY‚͂ӂ‚¤, ƒRƒ“ƒsƒ…[ƒ^‚̃tƒ@
ƒ“‚âˆÖŽq‚Ì‚«‚µ‚Þ‰¹, ŒÄ‹z‚©‚ç•·‚±‚¦‚éƒmƒCƒY‚É”ä‚ׂfl³‚È‚à‚Ì‚Å‚·.

ASR ƒ\ƒtƒgƒEƒFƒAƒpƒbƒP[ƒW‚É‚Í“Á’è‚̃TƒEƒ“ƒhƒJ[ƒh‚ð•K—v‚Æ‚·‚é‚à‚Ì‚ª‚ 
‚è‚Ü‚·. “Á’è‚̃n[ƒhƒEƒFƒA‚ւ̈ˑ¶‚ð”ð‚¯‚é‚̂͒ʏí—Ç‚¢‚±‚Æ‚Å‚·, ‚È‚º‚È
‚珫—ˆ‚Ì‘I‘ðŽˆ‚ð‹·‚ß‚Ä‚µ‚Ü‚¤‚©‚ç‚Å‚·. ‚à‚µ“KØ‚É“®ì‚·‚邽‚ß‚É‚Í“Á•Ê‚È
ƒn[ƒhƒEƒFƒA‚ª•K—v‚Æ‚È‚é‚悤‚ȃpƒbƒP[ƒW‚ðl‚¦‚Ä‚¢‚é‚Ì‚È‚ç, ‚ ‚È‚½‚Í—˜
‰v‚ƃRƒXƒg‚ðl—¶‚µ‚È‚¯‚ê‚΂Ȃç‚È‚¢‚Å‚µ‚傤.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

4.2. ƒ}ƒCƒN

ƒ}ƒCƒN‚Ì•iŽ¿‚Í ASR ‚ðŽg‚¤ã‚ŏd—v‚Å‚·. ‘½‚­‚̏ꍇ‚É‚¨‚¢‚Ä, ‘ìãƒ}ƒCƒN‚Í
‚±‚ÌŽg—p–@‚ÉŒü‚«‚Ü‚¹‚ñ. ŽüˆÍ‚̃mƒCƒY‚ðE‚¢‚ª‚¿‚É‚È‚é‚Ì‚Å, ASR ƒvƒƒOƒ‰
ƒ€‚ª‚¤‚Ü‚­“®ì‚µ‚È‚¢‚±‚Æ‚É‚È‚è‚Ü‚·.

ƒ}ƒCƒN‚ð‚¸‚Á‚ÆŽ‚¿‚‚¯‚Ä‚¢‚é‚Ì‚Í‘å•Ï‚È‚Ì‚Å, ƒnƒ“ƒhƒ}ƒCƒN‚àÅ‘P‚Ì‘I‘ð
‚Å‚Í‚ ‚è‚Ü‚¹‚ñ. ŽüˆÍ‚̃mƒCƒY‚Ì—Ê‚ð—}‚¦‚È‚ª‚ç, •p”ɂɘbŽÒ‚ª•Ï‚í‚éê‡‚â
”FŽ¯‘•’u‚ÉŒü‚Á‚Ęb‚·‚±‚Æ‚ª‚ ‚Ü‚è‚È‚¢ê‡‚Í (ƒwƒbƒhƒZƒbƒg‚ð•t‚¯‚邱‚Æ‚à
‘I‘ð‚Å‚«‚È‚¢‚Æ‚«) Å‚à•Ö—˜‚Å‚·.

’f‘Rl‹C‚Ì‚ ‚éˆê”Ô‚æ‚¢‘I‘ð‚̓wƒbƒhƒZƒbƒg‚Å‚·. ‚»‚ê‚ðŽg‚¦‚Î, ‚¢‚Â‚à‚ ‚È
‚½‚ÌŒû‚à‚ƂɃ}ƒCƒN‚ð’u‚¢‚½‚Ü‚Ü‚Å‚à, ŽüˆÍ‚Ì‘›‰¹‚ðÅ¬‚É—}‚¦‚邱‚Æ‚ª‚Å‚«
‚Ü‚·. ƒwƒbƒhƒZƒbƒg‚̓CƒAƒzƒ“‚Ì–³‚¢‚à‚Ì‚Æ‚ ‚é‚à‚Ì (ƒ‚ƒmƒ‰ƒ‹‚©ƒXƒeƒŒƒI‚©)
‚à‚ ‚è‚Ü‚·. ƒXƒeƒŒƒI‚̃wƒbƒhƒzƒ“‚ðŠ©‚ß‚Ü‚·‚ª, ‚»‚ê‚͌l‚̍D‚Ý‚Ì–â‘è‚Å
‚·.

$25 ‚©‚ç $100 ‚­‚ç‚¢‚Å‘f°‚炵‚¢«”\‚ðŽ‚Á‚½ƒwƒbƒhƒZƒbƒgŒ^ƒ}ƒCƒN‚ª”ƒ‚¦
‚Ü‚·. http://www.headphones.com ‚© http://www.speechcontrol.com ‚©‚ç’T
‚µ‚Ä‚Ý‚Ä‚­‚¾‚³‚¢.

ƒŒƒxƒ‹‚ɂ‚¢‚Ä‚Ì’Z‚©‚¢ƒƒ‚: ƒ}ƒCƒN‚̃{ƒŠƒ…[ƒ€‚ðã‚°‚邱‚Æ‚ð–Y‚ê‚È‚¢‚Å
‚­‚¾‚³‚¢. ‚±‚ê‚Í XMixer ‚© OSS Mixer ‚̂悤‚ȃvƒƒOƒ‰ƒ€‚ðŽg‚Á‚čs‚È‚¤‚±
‚Æ‚ª‚Å‚«‚Ü‚·, ‚»‚µ‚ătƒB[ƒhƒoƒbƒNƒmƒCƒY‚ð”ð‚¯‚é‚悤‚ÉŽg—p‚·‚邱‚Æ‚É’
ˆÓ‚µ‚Ä‚­‚¾‚³‚¢. ASR ƒ\ƒtƒgƒEƒFƒA‚ªŽ©“®’²ßƒvƒƒOƒ‰ƒ€‚ðŠÜ‚ñ‚Å‚¢‚ê‚Î, ‚»
‚ê‚ç‚ð‘ã‚è‚ÉŽg‚Á‚Ä‚­‚¾‚³‚¢, ‚»‚ê‚ç‚Í‚»‚Ì“Á’è‚Ì”FŽ¯ƒVƒXƒeƒ€‚ɍœK‰»‚³‚ê
‚Ä‚¢‚Ü‚·.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

4.3. ƒRƒ“ƒsƒ…[ƒ^/ƒvƒƒZƒbƒT

ASR ƒAƒvƒŠƒP[ƒVƒ‡ƒ“‚̓vƒƒZƒbƒT‚Ì‘¬“x‚É‹­‚­ˆË‘¶‚·‚邱‚Æ‚ª‚ ‚è‚Ü‚·. ‚±
‚ê‚Í ASR ‚Å‚Í‘å•Ï‚ȗʂ̃fƒBƒWƒ^ƒ‹ƒtƒBƒ‹ƒ^ƒŠƒ“ƒO‚ƐM†ˆ—‚ª‹N‚±‚肤‚é‚©
‚ç‚Å‚·.

CPU •‰‰×‚̍‚‚¢ƒ\ƒtƒgƒEƒFƒA‚Æ“¯‚¶‚­, ‘¬‚¢‚Ù‚Ç—Ç‚­‚È‚è‚Ü‚·. ‚Ü‚½, ƒƒ‚ƒŠ
‚ª‘å‚«‚¢’ö‚æ‚­‚È‚è‚Ü‚·. ‚¢‚­‚‚©‚Ì ASR ‚Í 100MHz ‚Æ 16MB ‚Ì RAM ‚Å‚à‰Â
”\‚Å‚·‚ª, ‚‘¬‚ŏˆ—‚·‚é (‘å‚«‚ÈŽ«‘‚â•¡ŽG‚È”FŽ¯ƒXƒL[ƒ€, ‚ƒTƒ“ƒvƒ‹ƒŒ
[ƒg) ‚É‚Í, Å’á‚Å‚à 400MHz ‚Å 128MB ‚Ì RAM ‚ª—Ç‚¢‚Å‚µ‚傤. •K—v‚Æ‚·‚é
ˆ—«”\‚ÌŠÖŒW‚Å, ‚Ù‚Æ‚ñ‚ǂ̃\ƒtƒgƒEƒFƒA‚ł͍ŏ¬ŒÀ‚Ì•K—vðŒ‚ª‹LÚ‚³‚ê
‚Ä‚¢‚Ü‚·.

‘å‹K–Í‚Ì”FŽ¯‚ðs‚È‚¤‚Ì‚É, ƒNƒ‰ƒXƒ^ (Beowulf ‚⑼‚à‚Ì‚à) ‚ð—˜—p‚·‚邱‚Æ
‚͍s‚È‚í‚ê‚Ä‚¢‚Ü‚¹‚ñ. is’†‚âŠJ”­’†‚̃vƒƒWƒFƒNƒg‚ð‚²‘¶’m‚Ȃ炨’m‚点
‚­‚¾‚³‚¢. scook@gear21.com <mailto:scook@gear21.com>

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5. ‰¹º”FŽ¯ƒ\ƒtƒgƒEƒFƒA

5.1. ƒtƒŠ[ƒ\ƒtƒgƒEƒFƒA

‚±‚±‚Å‹“‚°‚éƒtƒŠ[ƒ\ƒtƒgƒEƒFƒA‚Ì‘½‚­‚Í, ‚±‚±‚©‚çƒ_ƒEƒ“ƒ[ƒh‚Å‚«‚Ü‚·:
http://sunsite.uio.no/pub/Linux/sound/apps/speech/

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.1. XVoice

XVoice ‚Í‚³‚Ü‚´‚Ü‚È XWindow ƒAƒvƒŠƒP[ƒVƒ‡ƒ“‚ÅŽg—p‚Å‚«‚鉹º”FŽ¯‚̃\ƒt
ƒgƒEƒFƒA‚Å, ‘‚«Žæ‚è‚â˜A‘±‚µ‚½‰¹º”FŽ¯‚ª‰Â”\‚Å‚·. ƒ†[ƒU‚ªƒ}ƒNƒ‚ð’è‹`
‚·‚邱‚Æ‚à‚Å‚«, Šm‚©‚È–¢—ˆ‚Ì‚ ‚é—Ç‚¢ƒvƒƒOƒ‰ƒ€‚Å‚·. ˆê“xÝ’è‚·‚ê‚Î, [
•ª‚Ȑ¸“x‚Å“®ì‚µ‚Ü‚·.

XVoice ‚ðŽg‚¤‚½‚ß‚É‚Í IBM ‚Ì ViaVoice for Linux (¤—p‚Ìß‚ðŒ©‚Ä‚­‚¾‚³
‚¢) ‚ð“üŽè‚µ‚ăCƒ“ƒXƒg[ƒ‹‚·‚é•K—v‚ª‚ ‚è‚Ü‚·. ‚Ü‚½ ViaVoice ‚𐳂µ‚­“®
ì‚³‚¹‚邽‚߂ɐݒ肪•K—v‚Å‚·. ‰Á‚¦‚Ä Lesstif/Motif (libXm) ‚à•K—v‚Å‚·.
‚±‚̃vƒƒOƒ‰ƒ€‚Í X Window ‚Æ‚â‚è‚Æ‚è‚·‚é‚Ì‚Å, X ƒŠƒ\[ƒX‚ð—˜—p‚Å‚«‚é‚æ
‚¤‚É‚µ‚Ä‚¨‚©‚È‚¯‚ê‚΂Ȃç‚È‚¢‚±‚Æ‚É’ˆÓ‚·‚邱‚Æ‚àd—v‚Å‚·, ‚±‚Ì‚½‚ß, ƒl
ƒbƒgƒ[ƒN‚ÉŒp‚ª‚Á‚½ƒ}ƒVƒ“‚âƒ}ƒ‹ƒ`ƒ†[ƒU‚̃}ƒVƒ“‚ÅŽg—p‚·‚é‚Æ‚«‚Í, ‹C‚ð
•t‚¯‚Ä‚­‚¾‚³‚¢.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚Ƀ†[ƒUŒü‚¯‚Å‚·. RPM ‚ð“üŽè‚Å‚«‚Ü‚·.

HomePage: http://www.compapp.dcu.ie/~tdoris/Xvoice/ http://
www.zachary.com/creemer/xvoice.html

Project: http://xvoice.sourceforge.net

Community: http://www.onelist.com/community/xvoice

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.2. CVoiceControl/kVoiceControl

CVoiceControl (Console Voice Control ‚Ì—ª) ‚ÍŒ³X KVoiceControl(KDE
Voice Control) ‚Å‚µ‚½. ‚±‚̃vƒƒOƒ‰ƒ€‚̓†[ƒU‚ªƒRƒ}ƒ“ƒh‚ð˜b‚·‚±‚Æ‚Å
Linux ‚̃Rƒ}ƒ“ƒh‚ðŽÀs‚Å‚«‚é, Šî–{“I‚ȉ¹º”FŽ¯ƒVƒXƒeƒ€‚Å‚·.
CVoiceControl ‚ª KVoiceControl ‚É’u‚«‘ã‚í‚è‚Ü‚µ‚½.

‚±‚̃\ƒtƒgƒEƒFƒA‚ɂ̓}ƒCƒNƒŒƒxƒ‹‚ðÝ’è‚·‚郆[ƒeƒBƒŠƒeƒB, V‚µ‚¢ƒRƒ}ƒ“
ƒh‚Æ”­˜b‚ð’ljÁ‚·‚邽‚ß‚ÌŒêœbƒ‚ƒfƒ‹ƒGƒfƒBƒ^, ‰¹º”FŽ¯ƒVƒXƒeƒ€‚ªŠÜ‚Ü‚ê‚Ä
‚¢‚Ü‚·.

CVoiceControl ‚Í ASR ‚ðŽn‚߂悤‚Æ‚·‚éŒoŒ±–L•x‚ȃ†[ƒU‚É‚Æ‚Á‚Ä, ‘f°‚炵
‚¢o”­“_‚Æ‚È‚è‚Ü‚·. •K‚¸‚µ‚àƒ†[ƒUƒtƒŒƒ“ƒhƒŠ‚Å‚ ‚é‚Æ‚ÍŒ¾‚¦‚Ü‚¹‚ñ‚ª, ³
‚µ‚­ŠwK‚³‚¹‚ê‚Î, ‚Æ‚Ä‚à–𗧂¿‚Ü‚·. ƒZƒbƒgƒAƒbƒv‚ðs‚¤Žž‚ɂ̓hƒLƒ…ƒƒ“
ƒg‚ð—Ç‚­“Ç‚ñ‚Å‚­‚¾‚³‚¢.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚Ƀ†[ƒUŒü‚¯‚Å‚·.

Homepage: http://www.kiecza.de/daniel/linux/index.html

Documents: http://www.kiecza.de/daniel/linux/cvoicecontrol/index.html

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.3. Open Mind Speech

1999 ”NŒã”¼‚ÉŽn‚Ü‚Á‚½ Open Mind Speech ‚͉½“x‚©–¼‘O‚ð•Ï‚¦‚Ü‚µ‚½ (‚©‚‚Ä
‚Í VoiceControl, ‚»‚ÌŒã‚Í SpeechInput ‚Å, ‚»‚ê‚©‚ç FreeSpeech ‚Å‚·). ‚Ü
‚½¡‚Å‚Í, ƒI[ƒvƒ“ƒ\[ƒXƒvƒƒWƒFƒNƒg‚Ì "Open Mind Initiative" ‚̈ꕔ‚Å
‚·. ¡‚̏Š‚ÍŠ®‘S‚É‹@”\‚·‚é‚킯‚Å‚Í‚È‚­, Žå‚ÉŠJ”­ŽÒŒü‚¯‚Å‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

Homepage: http://freespeech.sourceforge.net

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.4. GVoice

GVoice ‚Í Gtk/GNOME ƒAƒvƒŠƒP[ƒVƒ‡ƒ“‚𐧌䂷‚邽‚ß‚É IBM ‚Ì (ƒtƒŠ[‚Ì)
ViaVoice SDK ‚ðŽg—p‚µ‚½‰¹º ASR ƒ‰ƒCƒuƒ‰ƒŠ‚Å, ‰Šú‰», ”FŽ¯ƒGƒ“ƒWƒ“, Ž«
‘‘€ì, ƒpƒlƒ‹‚̃Rƒ“ƒgƒ[ƒ‹‚ðs‚¤‚½‚߂̃‰ƒCƒuƒ‰ƒŠ‚ªŠÜ‚Ü‚ê‚Ä‚¢‚Ü‚·. ŠJ
”­‚͈ê”NˆÈã’â‘Ø‚µ‚Ä‚¢‚Ü‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

Homepage: http://www.cse.ogi.edu/~omega/gnome/gvoice/

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.5. ISIP

Mississippi State University ‚Ì Institute for Signal and Information
Processing ‚Í‚»‚̉¹º”FŽ¯ƒGƒ“ƒWƒ“‚ðŒöŠJ‚µ‚Ü‚µ‚½. ‚±‚̃c[ƒ‹ƒLƒbƒg‚̓tƒ
ƒ“ƒgƒGƒ“ƒh‚ƃfƒR[ƒ_[, ‚»‚µ‚ÄŒP—ûƒ‚ƒWƒ…[ƒ‹‚ðŠÜ‚ñ‚Å‚¢‚Ü‚·. ‚±‚ê‚Í‹@”\
“I‚ȃc[ƒ‹ƒLƒbƒg‚Å‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

‚±‚̃c[ƒ‹ƒLƒbƒg (‚Æ ISIP ‚ɂ‚¢‚Ă̏î•ñ) ‚Í‚±‚±‚Å“üŽè‚Å‚«‚Ü‚·: http://
www.isip.msstate.edu/project/speech/

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.6. CMU Sphinx

Sphinx ‚Í‚à‚Æ‚à‚Æ CMU ‚ÅŽn‚ß‚ç‚ê, Å‹ßƒI[ƒvƒ“ƒ\[ƒX‚Æ‚µ‚ÄŒöŠJ‚³‚ê‚Ü‚µ
‚½. ‚±‚ê‚Í‘½‚­‚̃c[ƒ‹‚Əî•ñ‚ðŠÜ‚ñ‚¾, ‚©‚È‚è‘å‚«‚ȃvƒƒOƒ‰ƒ€‚Å‚·. ‚±‚ê
‚Í‚¢‚Ü‚¾‚É"ŠJ”­’†"‚Å‚·‚ª, ŠwK‚Ì‚½‚߂̃\ƒtƒgƒEƒFƒA‚Æ”FŽ¯‘•’u, ‰¹‹¿ƒ‚ƒf
ƒ‹, Œ¾Œêƒ‚ƒfƒ‹, ì¬’†‚Ì•¶‘‚ðŠÜ‚ñ‚Å‚¢‚Ü‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

Homepage: http://www.speech.cs.cmu.edu/sphinx/Sphinx.html

Source: http://download.sourceforge.net/cmusphinx/sphinx2-0.1a.tar.gz

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.7. Ears

Ears ‚ÌŠJ”­‚ÍŠ®‘S‚Å‚Í‚ ‚è‚Ü‚¹‚ñ‚ª, ASR ‚ðŽn‚ß‚½‚¢‚ÆŽv‚Á‚Ä‚¢‚éƒvƒƒOƒ‰ƒ}
‚É‚Í—Ç‚¢‚«‚Á‚©‚¯‚É‚È‚é‚Å‚µ‚傤.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

FTP site: ftp://svr-ftp.eng.cam.ac.uk/comp.speech/recognition/

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.8. NICO ANN Toolkit

NICO Artificial Neural Network toolkit‚͉¹º”FŽ¯ƒAƒvƒŠƒP[ƒVƒ‡ƒ“‚ɍœK
‰»‚³‚ꂽƒtƒŒƒLƒVƒuƒ‹ƒoƒbƒNƒvƒƒpƒQ[ƒVƒ‡ƒ“ƒjƒ…[ƒ‰ƒ‹ƒlƒbƒgƒ[ƒNƒc[ƒ‹
ƒLƒbƒg‚Å‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

homepage: http://www.speech.kth.se/NICO/index.html

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.9. Myers' Hidden Markov Model Software

Richard Myers ‚Ì‚±‚̃\ƒtƒgƒEƒFƒA‚Í C++ ‚Å‹Lq‚³‚ꂽ HMM ƒAƒ‹ƒSƒŠƒYƒ€‚Å
‚·. ‚±‚ê‚Í L. Rabiner ‚Ì–{‚Å‚ ‚é "Fundamentals of Speech Recognition"
‚É‹Lq‚³‚ꂽ HMM ‚Ì‚½‚ß‚Ì—á‚ÆŠwKƒc[ƒ‹‚ð’ñ‹Ÿ‚µ‚Ü‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

î•ñ‚Í‚±‚±‚Å“üŽè‚Å‚«‚Ü‚·: http://www.itl.atr.co.jp/comp.speech/Section6
/Recognition/myers.hmm.html

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.10. Jialong He's Speech Recognition Research Tool

‚à‚Æ‚à‚Æ Linux Œü‚¯‚ɏ‘‚©‚ꂽ‚à‚Ì‚Å‚Í‚ ‚è‚Ü‚¹‚ñ‚ª, ‚±‚ÌŒ¤‹†ƒc[ƒ‹‚Í
Linux ‚ŃRƒ“ƒpƒCƒ‹‚Å‚«‚Ü‚·. ˆÙ‚È‚é3‚‚̃^ƒCƒv‚Ì”FŽ¯‘•’u‚ð”õ‚¦‚Ä‚¢‚Ü‚·:
DTW, Dynamic Hidden Markov Model, Continuous Density Hidden Markov
Model ‚Å‚·. ‚±‚ê‚ÍŒ¤‹†‚ÆŠJ”­—p‚Ì‚à‚Ì‚Å, Š®‘S‚È ASR ƒVƒXƒeƒ€‚Å‚Í‚ ‚è‚Ü‚¹
‚ñ. ‚±‚̃c[ƒ‹ƒLƒbƒg‚Í‚¢‚­‚‚©‚Ì•Ö—˜‚ȃc[ƒ‹‚ðŽ‚Á‚Ä‚¢‚Ü‚·.

‚±‚̃\ƒtƒgƒEƒFƒA‚ÍŽå‚ÉŠJ”­ŽÒ‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·.

‚³‚ç‚É‘½‚­‚̏î•ñ‚Í‚±‚±‚Å“üŽè‚Å‚«‚Ü‚·: http://www.itl.atr.co.jp/
comp.speech/Section6/Recognition/jialong.html

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.1.11. ‚Ü‚¾‘¼‚É‚à‚ ‚è‚Ü‚·‚©?

ã‹LˆÈŠO‚Ì‚à‚Ì‚ð‚²‘¶‚¶‚Ȃ玄‚Ü‚Å‚¨’m‚点‚­‚¾‚³‚¢: scook@gear21.com
<mailto:scook@gear21.com>. ‚à‚µ‚æ‚낵‚©‚Á‚½‚ç, Ð‰î’¸‚¢‚½ƒ\ƒtƒgƒEƒFƒA‚Ì
ƒRƒs[‚ð“üŽè‚Å‚«‚éêŠ‚à‹³‚¦‚Ä‚­‚¾‚³‚¢. ‚³‚ç‚ÉŠ´‘z‚à‘—‚Á‚Ä’¸‚¯‚é‚ƍK‚¢
‚Å‚·.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2. ¤—pƒ\ƒtƒgƒEƒFƒA

5.2.1. IBM ViaVoice

SDK ‚Ì–¢—ˆ‚Í‚Ç‚¤‚È‚é‚©‚í‚©‚è‚Ü‚¹‚ñ‚ª, IBM ‚Í ViaVoice ƒVƒŠ[ƒY‚Å Linux
‚ðƒTƒ|[ƒg‚·‚é‚Æ‚¢‚¤–ñ‘©‚ð‚µ‚Ä‚¢‚Ü‚·, (ŠJ”­ŽÒ‚Ƃ̃‰ƒCƒZƒ“ƒXŒ_–ñ‚ÍŒ»Žž“_
‚Å‚ÍŒöŽ®‚ɂ͍s‚í‚ê‚Ä‚¢‚Ü‚¹‚ñ, ‚à‚¤­‚µæ‚É‚È‚é‚Å‚µ‚傤. )

¤—p‚Ì (ƒtƒŠ[‚Å‚È‚¢) »•i‚Å‚ ‚é, IBM ViaVoice Dictation for Linux
(http://www-4.ibm.com/software/speech/linux/dictation.html ‚©‚ç“üŽè‚Å‚«
‚Ü‚·) ‚̐«”\‚Í‚Æ‚Ä‚à—Ç‚¢‚Ì‚Å‚·‚ª, Šî–{“I‚È ASR ƒVƒXƒeƒ€ (64M RAM ‚Æ
233MHz Pentium) ‚É”äŠr‚µ‚Ä‚³‚ç‚É‘å‚«‚ȃVƒXƒeƒ€‚ð•K—v‚Æ‚µ‚Ü‚·. $59.95US
‚Å Andrea NC-8 ƒ}ƒCƒN‚à•t‘®‚µ‚Ä‚¢‚Ü‚·. ƒ}ƒ‹ƒ`ƒ†[ƒU‚ÅŽg—p‚·‚邱‚Æ‚à‰Â”\
‚Å‚· (‚µ‚©‚µ, Ž„‚̓}ƒ‹ƒ`ƒ†[ƒU‚ÅŽÀŒ±‚µ‚Ä‚¢‚È‚¢‚Ì‚Å, ‚¾‚ê‚©ŽÀŒ±‚µ‚½l‚ª
‚¢‚ê‚ÎŽ„‚Ì‚¨‚µ‚è‚ð’@‚¢‚Ä‚­‚¾‚³‚¢). ‚±‚̃pƒbƒP[ƒW‚ÍŽŸ‚Ì‚à‚Ì‚ðŠÜ‚Ý‚Ü‚·:
•¶‘ (PDF), ŠwKƒc[ƒ‹, ‘‚«Žæ‚èƒVƒXƒeƒ€, ‚»‚ê‚©‚çƒCƒ“ƒXƒg[ƒ‹ƒXƒNƒŠƒv
ƒg. 2.2ŒnƒJ[ƒlƒ‹‚ðƒx[ƒX‚É‚µ‚½‘¼‚Ì Linux ƒfƒBƒXƒgƒŠƒrƒ…[ƒVƒ‡ƒ“‚̃Tƒ|
[ƒg‚àÅV‚̃ŠƒŠ[ƒX‚Å‚Í‚³‚ê‚Ä‚¢‚Ü‚·.

‚±‚Ì ASR SDK ‚ÍŽ©—R‚É“üŽè‚Å‚«, IBM ‚Ì SMAPI, •¶–@ API, •¶‘, ‚Æ—lX‚ȃT
ƒ“ƒvƒ‹ƒvƒƒOƒ‰ƒ€‚ðŠÜ‚ñ‚Å‚¢‚Ü‚·. ViaVoice Run Time Kit ‚͏‘‚«Žæ‚è‹@”\‚Ì
‚½‚ß‚Ì ASR ƒGƒ“ƒWƒ“‚ƃf[ƒ^ƒtƒ@ƒCƒ‹, ƒ†[ƒUƒ†[ƒeƒBƒŠƒeƒB‚ð’ñ‹Ÿ‚µ‚Ü‚·.
‚±‚Ì ViaVoice Command & Control Run Time Kit ‚͉¹º–½—߃VƒXƒeƒ€‚Ì‚½‚ß‚Ì
ASR ƒGƒ“ƒWƒ“‚ƃf[ƒ^ƒtƒ@ƒCƒ‹‚ƃ†[ƒUƒ†[ƒeƒBƒŠƒeƒB‚ðŠÜ‚ñ‚Å‚¢‚Ü‚·. ‚±‚Ì
SDK ‚Æ Kit ‚É‚Í 128MB ‚Ì RAM ‚Æ Linux 2.2 ˆÈã‚ª•K—v‚Å‚·.

SDK ‚Æ Kit ‚Í‚±‚±‚ÅŽ©—R‚É“üŽè‚Å‚«‚Ü‚·: http://www-4.ibm.com/software/
speech/dev/sdk_linux.html

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.2. Vocalis Speechware

Vocalis ‚Æ Vocalis Speechware ‚ɂ‚¢‚Ä‚Ì‚³‚ç‚È‚éî•ñ‚Í: http://
www.vocalisspeechware.com ‚Æ http://www.vocalis.com. 

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.3. Babel Technologies

Babel Technologies ‚Í Babear ‚ƌĂ΂ê‚é Linux SDK ‚ð’ñ‹Ÿ‚µ‚Ä‚¢‚Ü‚·. ‚±
‚ê‚Í Hybrid Markov Model ‚Æ Artificial Neural Network ƒeƒNƒmƒƒW‚ÉŠî‚Ã
‚¢‚½˜bŽÒ‚Ɉˑ¶‚µ‚È‚¢ƒVƒXƒeƒ€‚Å‚·. ƒeƒLƒXƒg‰¹º•ÏŠ·‚â˜bŽÒÆ‡, ‰¹‘f‰ðÍ
‚ÉŠÖ‚·‚邳‚Ü‚´‚܂Ȑ»•i‚ª‚ ‚è‚Ü‚·. ‘¼‚̏î•ñ‚ɂ‚¢‚Ä‚Í: http://
www.babeltech.com.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.4. SpeechWorks

”Þ‚ç‚̃EƒFƒuƒTƒCƒg‚Å‚Í Linux ‚ɂ‚¢‚Ä“Á‚ÉŒ¾‹y‚µ‚Ä‚¢‚Ü‚¹‚ñ‚ª, ”Þ‚ç‚Ì
"OpenSpeech Recognizer" ‚̓I[ƒvƒ“ƒXƒ^ƒ“ƒ_[ƒh‚Å‚ ‚é VoiceXML ‚ðŽg—p‚µ
‚Ä‚¢‚Ü‚·. ‘¼‚̏î•ñ‚ɂ‚¢‚Ä‚Í: http://www.speechworks.com.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.5. Nuance

Nuance ‚Í‚³‚Ü‚´‚Ü‚È *nix ƒvƒ‰ƒbƒgƒtƒH[ƒ€—p‚̉¹º”FŽ¯/Ž©‘RŒ¾Œê‚̐»•i
(Œ»Ý‚Í Nuance 8.0) ‚ð’ñ‹Ÿ‚µ‚Ä‚¢‚Ü‚·. ”ñí‚É‘å‚«‚ÈŒêœb‚ðˆµ‚¤‚±‚Æ‚ª‰Â”\
‚ŃXƒP[ƒ‰ƒrƒŠƒeƒB‚ƏáŠQ‹–—e‚Ì‚½‚ß‚É“Á—L‚Ì•ªŽUƒA[ƒLƒeƒNƒ`ƒƒ‚ðŽg—p‚µ‚Ä
‚¢‚Ü‚·. ‘¼‚̏î•ñ‚Í‚±‚±‚©‚ç“üŽè‚Å‚«‚Ü‚·: http://www.nuance.com.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.6. Abbot/AbbotDemo

Abbot ‚Í”ñí‚É‘å‚«‚ÈŒêœb, ˜bŽÒ‚Ɉˑ¶‚µ‚È‚¢ ASR ƒVƒXƒeƒ€‚Å‚·. ‚»‚ê‚Í‚à‚Æ
‚à‚Æ, Cambridge University ‚Ì Connectionist Speech Group‚É‚æ‚Á‚ÄŠJ”­‚³
‚ê, ‚¢‚Ü‚Í, SoftSound (¤—p)‚ɈڂÁ‚Ä‚¢‚Ü‚·. ‚­‚킵‚¢î•ñ‚Í: http://
www.softsound.com

AbbotDemo ‚Í Abbot ‚̃fƒ‚ƒpƒbƒP[ƒW‚Å‚·. ‚±‚̃fƒ‚ƒVƒXƒeƒ€‚Í–ñ 5000 Œê‚Ì
Œêœb‚ðŽ‚¿, connectionist/HMM ‚̘A‘±‚µ‚½‰¹ºƒAƒ‹ƒSƒŠƒYƒ€‚ð—˜—p‚µ‚Ä‚¢‚Ü
‚·. ‚±‚ê‚̓\[ƒXƒR[ƒh‚Ì•‘®‚µ‚È‚¢ƒfƒ‚ƒvƒƒOƒ‰ƒ€‚Å‚·.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.7. Entropic

Entropic ‚ÌŽü•Ó‚Ì—L”\‚Ȑl‚Í Micro$oft ‚É”ƒ‚¢Žæ‚ç‚ê‚Ä‚µ‚Ü‚¢‚Ü‚µ‚½. . .
»•i‚ƃTƒ|[ƒgƒT[ƒrƒX‚Í‘S‚ďÁ‚¦‚Ä‚µ‚Ü‚¢‚Ü‚µ‚½. HTK ‚Æ ESPS/waves+ ‚̃T
ƒ|[ƒg‚Í‘Å‚¿Ø‚ç‚ê‚Ä‚µ‚Ü‚¢, ”Þ‚ç‚Ì–¢—ˆ‚Í M$ ‚É‚©‚©‚Á‚Ä‚¢‚Ü‚·. ŒÃ‚¢ƒEƒF
ƒuƒTƒCƒg http://www.entropic.com ‚É‚³‚ç‚ɏî•ñ‚ª‚ ‚è‚Ü‚·.

K.K. Chin ‚ªŽ„‚É HTK ‚ÌŒ³X‚ÌŠJ”­ŽÒ (Cambridge ‚Ì Speech Vision and
Robotic Group) ‚ª‚Ü‚¾‚»‚ê‚ɑ΂·‚éƒTƒ|[ƒg‚ð‚µ‚Ä‚¢‚é‚Əî•ñ‚ð‚­‚ê‚Ü‚µ‚½. 
http://htk.eng.cam.ac.uk‚ł̓tƒŠ[‚ȃo[ƒWƒ‡ƒ“‚à“üŽè‚Å‚«‚Ü‚·. Microsoft
‚ªŒ»s‚Ì HTK ‚̃R[ƒh‚Ì’˜ìŒ ‚ðŠ—L‚µ‚Ä‚¢‚邱‚Æ‚É‚Í’ˆÓ‚µ‚Ä‚­‚¾‚³‚¢.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

5.2.8. ‘¼‚̏¤—p»•i

‚æ‚葽‚­‚̏¤—p‚Ì ASR »•i‚ª (L&H ‚ðŠÜ‚ß‚Ä) ‹ß‚¢«—ˆ“üŽè‚Å‚«‚é‚悤‚É‚È‚é
‚Æ‚¢‚¤‰\‚ª‚ ‚è‚Ü‚·. Ž„‚Í Comdex 2000 (Vegas) ‚Å L&H ‚Ì‘ã•\ 2,3 l‚Ƙb‚ð
‚µ‚Ü‚µ‚½‚ª, ’N‚à Linux ƒŠƒŠ[ƒX‚ɂ‚¢‚Ä, ‚Ü‚½ Linux Œü‚¯‚ɂǂ̐»•i‚̃Š
ƒŠ[ƒX‚ðŒv‰æ‚µ‚½‚Ì‚©‚ɂ‚¢‚Ä‚³‚¦î•ñ‚ð‚­‚ê‚Ü‚¹‚ñ‚Å‚µ‚½. ‚à‚µ‚±‚êˆÈã‚Ì
î•ñ‚ðŽ‚Á‚Ä‚¢‚ê‚Î, Ú×‚ðŽ„ scook@gear21.com <mailto:scook@gear21.com>
‚É‘—‚Á‚Ä‚­‚¾‚³‚¢.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

6. ‰¹º”FŽ¯‚Ì“à‘¤

6.1. ‚ǂ̂悤‚É”FŽ¯‚µ‚Ä‚¢‚é‚©

”FŽ¯ƒVƒXƒeƒ€‚Í 2 ‚‚̎å‚È•”•ª‚É•ª‰ð‚Å‚«‚Ü‚·. ƒpƒ^[ƒ“”FŽ¯ƒVƒXƒeƒ€‚Í“K‡
‚ð”»’f‚·‚邽‚߂Ƀpƒ^[ƒ“‚ðŠù’m‚Ì‚à‚Ì‚âŠwK‚µ‚½ƒpƒ^[ƒ“‚Æ”äŠr‚µ‚Ü‚·.
Acoustic Phonetic ƒVƒXƒeƒ€‚͉¹º‚Ì“Á’¥ (•ê‰¹‚Ȃǂ̉¹‚Ȃǂ̉¹º) ‚ð”äŠr
‚·‚邽‚߂ɐl‘Ì‚ÉŠÖ‚·‚é’mŽ¯ (º‚̐¶¬, ‚Æ’®Šo) ‚ð—˜—p‚µ‚Ü‚·. ‚Ù‚Æ‚ñ‚Ç‚Ì
Œ»‘ã“I‚ȃVƒXƒeƒ€‚Í‚±‚̂悤‚ȃpƒ^[ƒ“”FŽ¯ƒAƒvƒ[ƒ`‚ɏd“_‚ð’u‚¢‚Ä‚¢‚Ü‚·,
‚È‚º‚È‚ç. ‚»‚ê‚ÍŒ»Ý‚̃Rƒ“ƒsƒ…[ƒ^—˜—p‹Zp‚Æ‚¤‚Ü‚­Œ‹‚т‚«, ‚‚¢¸“x‚ð
“¾‚â‚·‚¢‚©‚ç‚Å‚·.

‚Ù‚Æ‚ñ‚Ç‚Ì”FŽ¯‘•’u‚͈ȉº‚̂悤‚È’iŠK‚É•ª‰ð‚Å‚«‚Ü‚·:

 1. ƒI[ƒfƒBƒI‚Ì‹L˜^‚Æ”­˜b‚ÌŒŸo
   
 2. ƒvƒŠƒtƒBƒ‹ƒ^ƒŠƒ“ƒO (ƒvƒŠƒGƒ“ƒtƒ@ƒTƒCƒY, ³‹K‰», ƒoƒ“ƒfƒBƒ“ƒO‚È‚Ç)
   
 3. ƒtƒŒ[ƒ~ƒ“ƒO‚ƃEƒBƒ“ƒhƒEƒBƒ“ƒO (ƒf[ƒ^‚ðŽg—p‚Å‚«‚éŒ`Ž®‚É•ª‰ð‚·‚é)
   
 4. ƒtƒBƒ‹ƒ^ƒŠƒ“ƒO (X‚É‚»‚ꂼ‚ê‚Ìwindow/frame/freq.band‚ðƒtƒBƒ‹ƒ^ƒŠƒ“
    ƒO)
   
 5. ”äŠr‚Æ“K‡ (”­˜b‚Ì”FŽ¯)
   
 6. “®ì (”FŽ¯‚³‚ꂽƒpƒ^[ƒ“‚ÉŠÖ˜A‚µ‚½‹@”\‚ðŽÀs)
   
‚»‚ꂼ‚ê‚Ì’iŠK‚Í’Pƒ‚ÉŒ©‚¦‚Ü‚·‚ª, ˆê‚ˆê‚‚͑½”‚̈قȂé (‚»‚µ‚Ä‚Æ‚«‚Ç
‚«‚ÍŠ®‘S‚É‹t‚Ì) ‹Zp‚ð—˜—p‚µ‚Ä‚¢‚Ü‚·.

(1) ƒI[ƒfƒBƒI/”­º‚̘^‰¹: ‚¢‚ë‚¢‚ë‚È•û–@‚ª‚ ‚è‚Ü‚·. Žn‚ß‚ÍŽüˆÍ‚̃I[ƒf
ƒBƒI‚̃Œƒxƒ‹ (‚¢‚­‚‚©‚̏ꍇ‚ł͉¹‹¿‚̃Gƒlƒ‹ƒM[) ‚ð˜^‰¹‚³‚ê‚Ä‚¢‚éƒTƒ“
ƒvƒ‹‚Æ”äŠr‚·‚邱‚Æ‚Å‚·. I“_‚Ì”»•Ê‚Í, ˜bŽÒ‚ªŒÄ‹z‚₽‚ß‘§, Ž•‚̖‚«, ƒG
ƒR[‚È‚Ç‚Ì "artifacts" ‚ðŽc‚µ‚ª‚¿‚È‚Ì‚Å‚³‚ç‚ɍ¢“ï‚Å‚·.

(2) ƒvƒŠƒtƒBƒ‹ƒ^ƒŠƒ“ƒO: ”FŽ¯ƒVƒXƒeƒ€‚Ì‘¼‚Ì‹@”\‚Ɉˑ¶‚µ‚Ä, ‚¢‚ë‚¢‚ë‚È•û
–@‚ōs‚È‚í‚ê‚Ü‚·. Å‚àˆê”Ê“I‚È•û–@‚Í, ƒTƒ“ƒvƒ‹‚̏€”õ‚Ì‚½‚߂Ɉê˜A‚̃I[
ƒfƒBƒIƒtƒBƒ‹ƒ^[‚ðŽg—p‚·‚é "Bank-of-Filters" –@‚Æ, ·ˆÙ(Œë·)‚ÌŒvŽZ‚Ì‚½
‚ß‚É—\‘ª‹@”\‚ðŽg—p‚·‚é Linear Predictive Coding –@‚Å‚·. ˆÙ‚È‚éŒ`Ž®‚̃X
ƒyƒNƒgƒ‹‰ðÍ‚à—˜—p‚³‚ê‚Ü‚·.

(3) ƒtƒŒ[ƒ~ƒ“ƒO/ƒEƒCƒ“ƒhƒEƒBƒ“ƒO‚̓Tƒ“ƒvƒ‹ƒf[ƒ^‚ð“Á’è‚Ì‘å‚«‚³‚É•ªŠ„‚·
‚邱‚Æ‚Å‚·. ‚±‚ê‚Í‚µ‚΂µ‚Î step2 ‚Æ step4 ‚֐i‚Ý‚Ü‚·. ‚±‚Ì’iŠK‚Í•ªÍ‚Ì
‚½‚߂ɃTƒ“ƒvƒ‹‹«ŠE (•£‚̃Jƒ`ƒ“‚Æ‚¢‚¤‰¹‚È‚Ç‚ðœ‚­‚±‚Æ) ‚ð—pˆÓ‚·‚邱‚Æ‚à
ŠÜ‚ñ‚Å‚¢‚Ü‚·.

(4) ’ljÁ‚̃tƒBƒ‹ƒ^ƒŠƒ“ƒO‚Í‚¢‚Â‚à‘¶Ý‚·‚é‚킯‚Å‚Í‚ ‚è‚Ü‚¹‚ñ. ‚±‚ê‚Í”äŠr
‚Æ“K‡‚Ì‘O‚Å‚Ì‚»‚ꂼ‚ê‚̃EƒBƒ“ƒhƒE‚ɑ΂·‚éÅŒã‚̏€”õ‚Å‚·. ‚µ‚΂µ‚΂±‚ê
‚ÍŽžŠÔ‚Ì”z’u‚Ɛ³‹K‰»‚©‚ç\¬‚³‚ê‚Ü‚·.

(5)‚Ì”äŠr‚Æ“K‡‚ɂ‚¢‚Ă͉”\‚È‹Zp‚ª‘å—Ê‚É‚ ‚è‚Ü‚·. ‚Ù‚Æ‚ñ‚Ç‚ÍŒ»Ý‚̃E
ƒBƒ“ƒhƒE‚ÆŠù’m‚̃Tƒ“ƒvƒ‹‚Ì”äŠr‚ð•K—v‚Æ‚µ‚Ü‚·.Hidden Markov Models
(HMM), Žü”g”‰ðÍ, ·ˆÙ‰ðÍ, üŒ^‘㐔‚Ì‹Zp/‹ß“¹, ƒXƒyƒNƒgƒ‹˜c‚ð—˜—p‚·
‚é•û–@‚⎞ŠÔ˜c‹È–@‚à‚ ‚è‚Ü‚·. ‚±‚ê‚ç‚Ì‚·‚ׂĂ̕û–@‚͈ê’v‚ÌŠm—¦‚Ɛ¸“x‚ð
“¾‚邽‚ß‚ÉŽg—p‚³‚ê‚Ä‚¢‚Ü‚·.

(6) “®ì‚ÍŠJ”­ŽÒ‚ª–]‚ñ‚¾‚±‚Æ‚¾‚¯‚Å‚·.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

6.2. ƒfƒBƒWƒ^ƒ‹ƒI[ƒfƒBƒI‚ÌŠî‘b

ƒI[ƒfƒBƒI‚Í–{Ž¿“I‚ɃAƒiƒƒO‚ÈŒ»Û‚Å‚·. ƒfƒBƒWƒ^ƒ‹ƒTƒ“ƒvƒ‹‚Ř^‰¹‚·‚邱
‚Æ‚Í, ƒ}ƒCƒN‚©‚ç‚̃AƒiƒƒOM†‚ðƒTƒEƒ“ƒhƒJ[ƒhã‚Ì A/D ƒRƒ“ƒo[ƒ^‚ŃfƒB
ƒWƒ^ƒ‹M†‚É•ÏŠ·‚·‚邱‚Æ‚Å‚·. ƒ}ƒCƒN‚ª“®ì‚µ‚Ä‚¢‚ê‚Î, ‰¹”g‚̓}ƒCƒN‚Ì’†
‚ÌŽ¥Î‚Ì—v‘f‚ðU“®‚³‚¹, ƒTƒEƒ“ƒhƒJ[ƒh‚Ö‚Ì“d—¬ (ƒXƒs[ƒJ‚ª‹t‚É“®ì‚µ‚Ä
‚¢‚é‚ƍl‚¦‚Ä‚­‚¾‚³‚¢) ‚𔭐¶‚³‚¹‚Ü‚·. Šî–{“I‚É‚»‚ÌA/DƒRƒ“ƒo[ƒ^‚Í“Á’è‚Ì
ŠÔŠu‚Å‚Ì“dˆ³‚Ì’l‚ð‹L˜^‚µ‚Ü‚·.

‚±‚̉ߒö‚Ì’†‚É2‚‚̏d—v‚È—v‘f‚ª‚ ‚è‚Ü‚·. 1‚Â‚ß‚Í "sample rate", ‚ ‚é‚¢
‚͂ǂ̂悤‚È•p“x‚Å“dˆ³‚ð‹L˜^‚·‚é‚Ì‚©‚Æ‚¢‚¤‚à‚Ì. 2‚Â‚ß‚Í "bits per
second", ‚ǂ̂悤‚Ȑ¸“x‚Å’l‚ª‹L˜^‚³‚ê‚é‚©‚Æ‚¢‚¤‚à‚Ì‚Å‚·. 3‚‚߂̗v‘f‚Í
ƒ`ƒƒƒ“ƒlƒ‹‚̐” (ƒ‚ƒm‚©ƒXƒeƒŒƒI‚©), ‚µ‚©‚µ, ‘½‚­‚Ì ASR ƒAƒvƒŠƒP[ƒVƒ‡ƒ“
‚ł̓‚ƒm‚ŏ\•ª‚Å‚·. ‘½‚­‚̃AƒvƒŠƒP[ƒVƒ‡ƒ“‚Å‚Í‚±‚ê‚ç‚̃pƒ‰ƒ[ƒ^‚É—\‚ß
Ý’肳‚ꂽ’l‚ðŽg—p‚µ‚Ä, ƒ†[ƒU‚Í•¶‘‚ɏ‘‚©‚ê‚Ä‚¢‚È‚¢‚©‚¬‚è•ÏX‚·‚é‚ׂ«
‚Å‚Í‚ ‚è‚Ü‚¹‚ñ. ŠJ”­ŽÒ‚͈قȂé’l‚Å‚»‚̃Aƒ‹ƒSƒŠƒYƒ€‚Ƃ͉½‚ª‡‚¤‚Ì‚©‚ðŽÀ
Œ±‚·‚邱‚Æ‚ÅŒˆ’è‚·‚é‚ׂ«‚Å‚·.

‚»‚ê‚Å‚Í, ASR ‚ɂ‚¢‚Ă͂ǂ̂悤‚ȃTƒ“ƒvƒ‹ƒŒ[ƒg‚ª—Ç‚¢‚Ì‚Å‚µ‚傤‚©? ‰¹
º‚Í”äŠr“I’á‚¢‘ш敝 (‚Ù‚Æ‚ñ‚Ç 100Hz ‚©‚ç 8kHz) ‚Å‚·‚©‚ç, 8000 samples/
sec (8kHz) ‚Í‚Ù‚Æ‚ñ‚Ç‚ÌŠî–{“I‚È ASR ‚ɑ΂µ‚Ă͏\•ª‚Å‚·. ‚µ‚©‚µ, ‚³‚ç‚É
³Šm‚ȍ‚Žü”g”‚̏î•ñ‚𓾂ç‚ê‚é‚Ì‚Å 16000 samples/sec(16kHz) ‚ðD‚ސl‚à
‚¢‚Ü‚·. ‚à‚µˆ—”\—Í‚ª‚ ‚ê‚Î 16kHz ‚ðŽg‚¤‚ׂ«‚Å‚·. ‚Ù‚Æ‚ñ‚Ç‚Ì ASR ƒAƒv
ƒŠƒP[ƒVƒ‡ƒ“‚Å‚Í 22kHz ˆÈã‚̃Tƒ“ƒvƒŠƒ“ƒOƒŒ[ƒg‚Í–³‘Ê‚Å‚·.

‚»‚µ‚Ăǂ̂悤‚È’l‚ª "bits per sample" (1ƒTƒ“ƒvƒ‹“–‚è‚̃rƒbƒg”) ‚ɂ‚¢
‚Ä—Ç‚¢‚Ì‚Å‚µ‚傤‚©? 8 bits per sample ‚Í 0 ‚©‚ç 255 ‚ÌŠÔ‚Å’l‚ð‹L˜^‚µ‚Ü
‚·, ‚±‚ê‚̓}ƒCƒN¬•ª‚Ì‘å‚«‚³‚ª 256ŒÂ‚Ì’†‚Ì1‚‚ł ‚é‚Æ‚¢‚¤‚±‚Æ‚ðˆÓ–¡‚µ‚Ü
‚·. 16 bits per sample‚͐¬•ª‚Ì‘å‚«‚³‚ð 65536 ŒÂ‚É•ªŠ„‚µ‚Ü‚·. ƒTƒ“ƒvƒ‹ƒŒ
[ƒg‚à“¯—l‚Å‚·. ”äŠr‚Ì‚½‚ß‚É, ‰¹Šy—p Compact Disc ‚Í 44kHz ‚Å 16 bits
per sample‚ŃGƒ“ƒR[ƒh‚³‚ê‚Ä‚¢‚Ü‚·.

Žg—p‚³‚ê‚éƒGƒ“ƒR[ƒfƒBƒ“ƒOƒtƒH[ƒ}ƒbƒg‚͐üŒ^‚È•„†•t‚ ‚é‚¢‚Í•„†‚È‚µ®
”‚̂悤‚É’Pƒ‚Å‚ ‚é‚ׂ«‚Å‚·. U-Law/A-Law ƒAƒ‹ƒSƒŠƒYƒ€‚Ü‚½‚Í‘¼‚̈³k–@
‚ðŽg—p‚·‚邱‚Æ‚Í•’ʉ¿’l‚ª‚ ‚è‚Ü‚¹‚ñ, ‚È‚º‚È‚ç‚»‚ê‚ÍŒvŽZ”\—͂̃RƒXƒg‚ª
‚©‚©‚è, ƒRƒXƒg‚ÉŒ©‡‚Á‚½”\—Í‚ð\•ª‚É“¾‚邱‚Æ‚ª‚Å‚«‚È‚¢‚©‚ç‚Å‚·

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

7. o”Å•¨

‚±‚̃ŠƒXƒg‚ɍڂÁ‚Ä‚¢‚È‚¢‚à‚Ì‚Å, ‚±‚±‚ɉÁ‚¦‚½‚Ù‚¤‚ª‚¢‚¢‚ÆŽv‚¤o”Å•¨‚ª‚ 
‚ê‚Î, Ž„scook@gear21.com <mailto:scook@gear21.com>‚֏î•ñ‚ð‘—‚Á‚Ä‚­‚¾‚³
‚¢.

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

7.1. ‘Ð

 E "Fundamentals of Speech Recognition". L. Rabiner & B. Juang. 1993.
    ISBN: 0130151572.
   
 E "How to Build a Speech Recognition Application". B. Balentine, D.
    Morgan, and W. Meisel. 1999. ISBN: 0967127815.
   
 E "Speech Recognition : Theory and C++ Implementation". C. Becchetti
    and L.P. Ricotti. 1999. ISBN: 0471977306.
   
 E "Applied Speech Technology". A. Syrdal, R. Bennett, S. Greenspan.
    1994. ISBN: 0849394562.
   
 E "Speech Recognition : The Complete Practical Reference Guide". P.
    Foster, T. Schalk. 1993. ISBN: 0936648392.
   
 E "Speech and Language Processing: An Introduction to Natural
    Language Processing, Computational Linguistics and Speech
    Recognition". D. Jurafsky, J. Martin. 2000. ISBN: 0130950696.
   
 E "Discrete-Time Processing of Speech Signals (IEEE Press Classic
    Reissue)". J. Deller, J. Hansen, J. Proakis. 1999. ISBN:
    0780353862.
   
 E "Statistical Methods for Speech Recognition (Language, Speech, and
    Communication)". F. Jelinek. 1999. ISBN: 0262100665.
   
 E "Digital Processing of Speech Signals" L. Rabiner, R. Schafer.
    1978. ISBN: 0132136031
   
 E "Foundations of Statistical Natural Language Processing". C.
    Manning, H. Schutze. 1999. ISBN: 0262133601.
   
‘½”‚̃Iƒ“ƒ‰ƒCƒ“‚Å“Ç‚ß‚é‘ã‹L‚ª‚ ‚é‚Ì‚Å, Institut Fur Phoneti ‚ðƒ`ƒFƒbƒN
‚µ‚½‚Ù‚¤‚ª‚¢‚¢‚Å‚µ‚傤: http://www.informatik.uni-frankfurt.de/~ifb/
bib_engl.html

„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

7.2. ƒCƒ“ƒ^[ƒlƒbƒg

news:comp.speech
   
    ƒRƒ“ƒsƒ…[ƒ^‚Ɖ¹º‚ÉŠÖ‚·‚éƒjƒ…[ƒXƒOƒ‹[ƒv‚Å‚·.
   
       US: http://www.speech.cs.cmu.edu/comp.speech/
       
       UK: http://svr-www.eng.cam.ac.uk/comp.speech/
       
       Aus: http://www.speech.su.oz.au/comp.speech/
       
news:comp.speech.users
   
    ‰¹º‚ÉŠÖ‚·‚éƒ\ƒtƒgƒEƒFƒA‚̃†[ƒU‚Ì‚½‚߂̃jƒ…[ƒXƒOƒ‹[ƒv‚Å‚·.
   
       http://www.speechtechnology.com/users/comp.speech.users.html
       
news:comp.speech.research
   
    ‰¹º‚ÉŠÖŒW‚µ‚½ƒ\ƒtƒgƒEƒFƒA‚ƃn[ƒhƒEƒFƒA‚Ì‚½‚߂̃jƒ…[ƒXƒOƒ‹[ƒv‚Å
    ‚·.
   
news:comp.dsp
   
    ƒfƒBƒWƒ^ƒ‹M†ˆ—‚Ì‚½‚߂̃jƒ…[ƒXƒOƒ‹[ƒv‚Å‚·.
   
news:alt.sci.physics.acoustics
   
    ‰¹‚Ì•¨—Šw‚Ì‚½‚߂̃jƒ…[ƒXƒOƒ‹[ƒv‚Å‚·.
   
DDLinux Email List
   
    Linux ‚̉¹º”FŽ¯‚̃[ƒŠƒ“ƒOƒŠƒXƒg‚Å‚·.
   
       Homepage: http://leb.net/ddlinux/
       
       Archives: http://leb.net/pipermail/ddlinux/
       
Linux Software Repository for speech applications
   
    http://sunsite.uio.no/pub/linux/sound/apps/speech/
   
Russ Wilcox's List of Speech Recognition Links
   
    (excellent) http://www.tiac.net/users/rwilcox/speech.html
   
Online Bibliography
   
    Online Bibliography of Phonetics and Speech Technology
    Publications. http://www.informatik.uni-frankfurt.de/~ifb/
    bib_engl.html
   
MIT's Spoken Language Systems Homepage
   
    http://www.sls.lcs.mit.edu/sls/
   
Oregon Graduate Institute
   
    Oregon Graduate Institute ‚Ì Spoken Language Understanding ‚̃Zƒ“ƒ^
    [‚Å‚·. ŠJ”­ŽÒ‚ÆŒ¤‹†ŽÒ‚É‚Æ‚Á‚Ä‘f°‚炵‚¢êŠ‚Å‚·. http://
    cslu.cse.ogi.edu/
   
IBM's ViaVoice Linux SDK
   
    http://www-4.ibm.com/software/speech/dev/sdk_linux.html
   
Mississippi State
   
    Signal and Information Processing‚ɂ‚¢‚Ẵ~ƒVƒVƒbƒsB—§‘åŠwŠJ”­ŽÒ
    ‚ÉŒü‚¯‚½‘å—ʂ̏î•ñ‚ª‚ ‚éƒz[ƒ€ƒy[ƒW‚Å‚·. http://
    www.isip.msstate.edu/projects/speech/
   
Speech Technology
   
    ASR ƒ\ƒtƒgƒEƒFƒA‚ƃAƒNƒZƒTƒŠ‚Å‚·. http://www.speechtechnology.com
   
Speech Control
   
    ‰¹º§Œä‚̃Rƒ“ƒsƒ…[ƒ^ƒVƒXƒeƒ€. ASR—p‚̃}ƒCƒN, ƒwƒbƒhƒZƒbƒg, ƒƒCƒ„
    ƒŒƒX»•i‚Å‚·. http://www.speechcontrol.com
   
Microphones.com
   
    ASR —p‚̃}ƒCƒN‚ƃAƒNƒZƒTƒŠ‚Å‚·. http://www.microphones.com
   
21st Century Eloquence
   
    "Speech Recognition Specialists." http://voicerecognition.com
   
Computing Out Loud
   
    Žå‚É‚Í Windows ƒ†[ƒU‚ÉŒü‚¯‚½‚à‚Ì‚Å‚·‚ª, —Ç‚¢î•ñ‚ª‚ ‚è‚Ü‚·. http:/
    /www.out-loud.com
   
Say I Can.com
   
    "The Speech Recognition Information Source." http://www.sayican.com
   
„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª„ª

8. “ú–{Œê–ó‚ɂ‚¢‚Ä

“ú–{Œê–ó‚Í Linux Japanese FAQ Project ‚ªs‚¢‚Ü‚µ‚½. –|–ó‚ÉŠÖ‚·‚邲ˆÓŒ©
‚Í JF ƒvƒƒWƒFƒNƒg <JF@linux.or.jp> ˆ¶‚ɘA—‚µ‚Ä‚­‚¾‚³‚¢.

1.2j

–|–ó:
   
    •ž•”‚Ž‘ <htakashi@yabumi.com>
   
Z³:
   
       ’†’JçŠG <jeanne@mbox.kyoto-inet.or.jp>
       
       –ì–{_ˆê <hng@ps.ksky.ne.jp>