Lisa J. Stifelman
CHI'96 Conference Companion, pp. 199-200, April 1996
ノートのページに音声がリンクされる。 ノートのページを開いて書いた字の場所を指すと その音声の部分へ飛ぶ。
「開いたページ認識」の技法が使われている。

詳細 Wikiページ作成 関連カテゴリ: 音声 実世界指向インタフェース CHI96発表論文 ユーザインタフェース全般

Barry Arons
Hyperspeech: Navigating in speech-only hypermedia
Hypertext '91 Proceedings, pp. 133-146, 1991

詳細 Wikiページ作成 関連カテゴリ: ハイパーテキスト 音声

S. Joy Mountford, William W. Gaver
Talking and Listening to Computers
音声及び非音声インタフェースの概要。

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

吉田 英昭, 平松 敬史, 野村 康雄, 山下 洋一, 溝口 理一郎
機械への音声入力のための汎用対話管理システム

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

森島 繁生, 原島 博
マルチメディア電子メールシステムの提案
テレビジョン学会技術報告, Vol. 15, No. 60, pp. 25 - 28, October 1991

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

森木 紀恵, 絹川 博之
自然語インタフェースのための音声ガイダンス

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

渡辺 富夫
マン・マシン・インタフェースにおける音声対話速度の適応化

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

C. M. Mitchell, M. G. Forren
Multimodal user input to supervisory control systems: voice-augmented keyboard
IEEE transactions on systems, man and cybernetics, Vol. 17, No. 4, pp. 594-607, July/August 1987

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

John C. Thomas, Mary Beth Rosson, Martin Chodorow
Human Factors and Synthetic Speech
Proceedings of IFIP INTERACT'84: Human-Computer Interaction, pp. 219-224, 1984

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

村本 紘, 坂谷内 勝, 松田 昇, 山田 勝
音声再生機能を組み込んだCAIシステム

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

鶴藤 真一, 大西 宏樹, 飯田 正幸, 鈴木 龍司
音声認識カーオーディオの開発
自動車内のオーディオを音声で制御する装置。 音楽の音が認識にとって一番問題になるので、 非認識期間に音量レベルを調べて閾値を変更する機能や だんだん認識の基準を甘くする言い直し機能などを もうけている。商品になっている。

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

M. J. Muller, J. E. Daniel
Toward a Definition of Voice Documents
Proceedings of COIS'90, pp. 174-183, 1990

詳細 Wikiページ作成 関連カテゴリ: 音声

竹内 彰一, 長尾 確
新たなコミュニケーションモダリティとしての表情
情報処理学会 情報メディア研究会研究報告 93-IM-9, January 1993

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

牧野 秀夫, 石井 郁夫, 馬場 麻理, 大塚 清和, 大和 淳二
盲人用地図作成および音声案内システムの開発
電子情報通信学会論文誌A, Vol. J73-A, No. 3, pp. 619-626, March 1990

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般 盲人向けシステム

竹林 洋一, 永田 仁史, 瀬戸 重宣, 新地 秀昭, 橋本 秀樹
音声自由対話システムTOSBURG II -- マルチモーダル 応答と音声応答キャンセルの利用
情報処理学会ヒューマンインタフェース研究会研究報告 92-HI-45, Vol. 92, 1992

詳細 Wikiページ作成 関連カテゴリ: 音声

間瀬 健二, 福本 雅朗, 末永 康仁
音声と映像コマンドを統合したマルチメディアインタフェース
情報処理学会 情報メディア研究会研究報告 92-IM-5, March 1992
計算機と人間のインタフェースは、文化の異なる者の間の 通訳者のようなものと考え、表情やジェスチャなどいろいろな 表現をインタフェースに活用しようとする試み。 ビデオカメラで顔や手の動きを認識したり音声認識したり する。(Human Reader = Head Reader + Hand Reader + ...)

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

瀬戸 重宣, 永田 仁史, 山下 泰樹, 竹林 洋一
実時間音声対話システムにおけるマルチモーダル応答

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Gale L. Martin
The Utility of Speech Input in User-Computer Interfaces
International Journal of Man-Machine Studies, Vol. 30, No. 4, pp. 355-375

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

John A. Waterworth, Cathy M. Thomas
Why is Synthetic Speech Harder to Remember than Natural Speech?
Proceedings of ACM CHI'85 Conference on Human Factors in Computing Systems, pp. 201-206, 1985

詳細 Wikiページ作成 関連カテゴリ: CHI85発表論文 ユーザインタフェース全般 音声

前田 利之, 中川 雅通, 登 一生, 前原 文雄
音声・画像インターフェースを持つ翻訳システムにおける、 コンテキストの適用
電子情報通信学会秋季全国大会論文集, pp. 6 - 120, October 1990

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Christopher Schmandt
Voice Communication with Computers
Van Nostrand Reinhold, 1994

詳細 Wikiページ作成 関連カテゴリ: 音声

Jean-Michel Lunati, Alexander I. Rudnicky
Spoken Language Interfaces: The OM System
Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI'91), pp. 453-454, April 1991
音声認識器をモジュール分けしてつくるアーキテクチャ。 ブロック図しか書いていないが、音声用UIMSのようなもの のようである。それ自体はちっとも面白くない。

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI91発表論文

Chris M. Schmandt
Voice Communication with Computers
Advances in Human-Computer Interaction, pp. 133-159, 1985

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

Lester F. Ludwig, Natalio Pincever, Michael Cohen
Extending the Notion of a Window System to Audio
IEEE Computer, Vol. 23, No. 8, pp. 66-72, August 1990
マルチウィンドウはひとつの画面にたくさんのアプリを出すのに 成功しているから、ひとつの音声チャネルにたくさんの音声 出力をすることも可能だろう、という話らしい。特定の音声を 強調するためにエフェクタを使ったりするようである。

詳細 Wikiページ作成 関連カテゴリ: 音声

Chris Schmandt, Debby Hindus, Mark S. Ackerman, Sanjay Manandhar
Observations on Using Speech Input for Window Navigation
Proceedings of IFIP INTERACT'90: Human-Computer Interaction, pp. 787-793, 1990

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

Matthew Lennig
Putting Speech Recognition to Work in the Telephone Network
IEEE Computer, Vol. 23, No. 8, pp. 35-41, August 1990
カナダの電話会社で実際に電話局に設置した音声認識装置を 使って各種サービスをした実験。例えば「増井」という客が デパートにコレクトコールをする場合は、 客: "0-(店の番号)"をダイヤル システム: 「コレクトコールなら1を押して下さい」 客: "1"をダイヤル システム: 「あなたのお名前は?」 客: 「増井」 という問答がある。最後の名前はシステムにより録音される。 この後システムは録音された名前を使ってデパートに電話をかける。 デパート: 「なんとかデパートです。」 システム: 「「増井」さんからコレクトコールが入ってます。 受けますか?」 デパート: 「え?」 システム: 「「増井」という人からコレクトコールが入ってます。 受けるかどうか、「はい」「いいえ」で答えて下さい」 デパート: 「はい」 という感じである。 ここで認識システムは「はい」「いいえ」を正しく認識し、 関係ない答えをはじくように注意する。運用結果はなかなか 良好である。 上の例でわかるように、対話の設計がとても重要である。
「増井です」とか答えたらどうなるのだろうか。

詳細 Wikiページ作成 関連カテゴリ: 音声

Chris Schmandt
Illusion in the Interface
音声インタフェースにおいてユーザをうまく騙す方法。 (その1)「Phone Slave」…留守番電話が品質の良い音で 「どなたですか?」などと順番に聞くことにより、その後の 応答に名前が入っていると期待する。音声認識などは一切 行なわないが、これが意外とうまく動く。 (その2)「Conversational Desktop」音声認識機械は 自分が必要とされているかどうか判断するのが難しいが、 声の大小で音声認識機構をON/OFFする。 (その3)「Grunt」…音声合成で機械が人間に解説をする システムであるが、人間が無反応だったりすると「聞いて るの?」などと質問する。人間が「うん」などと短い応答 をしたときは聞いていると判断してどんどん続けていくが、 「もう一度説明して」のように長い応答をしたときは 問題があったと判断して説明を繰り返す。「何?」のように 応答は短いが問題がある場合は、声の調子が肯定の場合と 異なることを利用して、問題があったと判断する。 これらのシステムはすべてまともな音声認識を行なって いないにもかかわらず、いかにもまともに動いているように ユーザが感じるように工夫をしている。

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

Brenda Laurel
Addison-Wesley, Reading, Massachusetts, 1990

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

斉藤 成利, 原 義幸, 新田 恒雄, 斉藤 裕実, 栗原 基, 小林 賢一郎
音声規則合成による電子メール読みあげサービスシステム
メールを読みあげる前にシステムがいくつかしゃべるので、 その間にユーザが合成音に慣れるのではないか、と書いてある。

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

小林 豊, 遠藤 栄憲, 表 雅則, 新美 康永
音声インターフェイスをもつ情報検索システム
電子情報通信学会技術研究報告, Vol. 90, No. 178,179, pp. 15 - 22, August 1990

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Mark W. Salisbury, Joseph H. Hendrickson, Terence L. Lammers, Caroline Fu, Scott A. Moody
Talk and Draw: Bundling Speech and Graphics
IEEE Computer, Vol. 23, No. 8, pp. 59-65, August 1990
「Put that there」と同じように、音声とジェスチャを くみあわせるとうまくいくという話らしい。

詳細 Wikiページ作成 関連カテゴリ: 音声

小山 智司, 野島 秀夫, 太田 茂
視覚障害者に対応する計算機インタフェース
電子情報通信学会論文誌D-II, Vol. J72-D-II, No. 1, pp. 185-192, January 1989

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般 盲人向けシステム

小林 哲則, 竹内 陽児, 白井 克彦
音声・マウス・キーボードによる統合的入力環境
電子情報通信学会技術研究報告, Vol. 92, No. 491, pp. 19 - 24, March 1993

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Richard D. Peacocke, Daryl H. Graf
An Introduction to Speech and Speaker Recognition
IEEE Computer, Vol. 23, No. 8, pp. 26-33, August 1990

詳細 Wikiページ作成 関連カテゴリ: 音声

小山 智史, 野島 秀夫, 太田 茂, 川野 勇, 城戸 勝康, 長谷川 貞夫
合成音声による盲人用多目的日本語処理システム
計測自動制御学会 第7会ヒューマン・インタフェース研究会, Vol. 3, No. 2, April 1988

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Michael H. O'Malley
Text-To-Speech Conversion Technology
IEEE Computer, Vol. 23, No. 8, pp. 17-23, August 1990

詳細 Wikiページ作成 関連カテゴリ: 音声

北井 幹雄, 今村 明弘
音声対話システムにおける操作性向上の検討
電子情報通信学会秋季全国大会論文集, pp. 1.124 - 1.125, October 1990

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Lee Sherman
Talk is Cheap
NextWorld, pp. 53-54, Summer 1992

詳細 Wikiページ作成 関連カテゴリ: 音声

菊池 英明, 工藤 育男, 小林 哲則, 白井 克彦
ナビゲーションシステムにおける音声対話インターフェースの構成

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

永田 仁史, 橋本 秀樹, 竹林 洋一
ワークステーション上でのソフト音声認識とその応用

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

草浦 信彦, 川澄 正史, 小椋 靖夫, 平松 啓二
音声を用いたカーソル位置制御システム

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

成田 滋, 桑沢 哲也
話声入力による身体障害者(児)のコンピュータ利用の可能性
電子情報通信学会技術研究報告, Vol. 89, No. 401, pp. 69 - 72, January 1990

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

門脇 久, 森本 一成, 西村 武
音声によるポインティング操作の評価

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

山下 泰樹, 瀬戸 重宣, 坪井 宏之, 竹林 洋一
自由発話による実時間音声対話システムTOSBURGの応答生成
人工知能学会研究会資料SIG-HICG-9201, May 1992

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

片岸 一起, 谷戸 文広, 樋口 宜男
所内内線電話番号案内システムの使い勝手の良さについての考察
電子情報通信学会技術研究報告, Vol. 89, No. 387,388, pp. 79-84, January 1990

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

J. A. Waterworth
Interaction with Machines by Voice: A Telecommunications Perspective
Behaviour and Information Technology, Vol. 3, No. 2, pp. 163-177, 1984

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

R. M. Kane, M. Yuschik
A Case Example Of Human Factors In Product Definition: Needs Finding For A Voice Output Workstation For The Blind
Proceedings of the CHI + GI '87 Conference on Human Factors In Computing Systems and Graphic Interfaces, pp. 69-73, April 1987

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI87発表論文 ユーザインタフェース全般

Philip Tucker, Dylan M. Jones
Voice as Interface: An Overview
International Journal of Human-Computer Interaction, Vol. 3, No. 2, pp. 145-170, 1991

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

Ragui Kamel, Kamyar Emami, Robert Eckert
PX: Supporting Voice in Workstations
IEEE Computer, Vol. 23, No. 8, pp. 73-80, August 1990
「計算機つき電話」といったところか。PBXを計算機で制御 したり、グラフィック画面で転送電話を指定できたりする。 (例えば転送電話の場合、画面上のアイコン間に線をひくだけ でよい)

詳細 Wikiページ作成 関連カテゴリ: 音声

竹林 洋一, 坪井 宏之, 金澤 博史, 貞本 洋一, 山下 泰樹, 永田 仁史, 瀬戸 重宣, 新居 孝章, 橋本 秀樹, 新地 秀昭
不特定話者音声対話システムTOSBURGの開発
日本音響学会春季講演論文集, No. 1-P-16, pp. 135-136, March 1992

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Ragui Kamel
Voice in Computing
IEEE Computer, Vol. 23, No. 8, pp. 8-9, August 1990
音声特集号の巻頭解説。 ○ 音声を計算機で使うといっても計算機屋と通信(電話)屋 では見方がかなり違う。(Kamel氏本人は電話屋である。) 音声処理には以下のようなカテゴリがある。 ● 電話制御 ・電話帳を調べる ・自動的に電話をかけて商売する(テレマーケッティング) ・転送電話、多者間電話などを簡単に設定できるようにする ・電話をかけてきた人を調べる ● 音声録再 計算機は音声を切りかえるだけのものが多いが、データと して扱うことにより以下のようなことが可能になる。 ・計算機による留守番電話 ・音声つき文書 ・すぐれたテレマーケティング ● 音声処理 ・電話で音声認識、合成をやる ● 音声UI ・認識はまだ使えるレベルでないのでいろいろ工夫が必要である。 ○ 音声ワークステーションKamel_PX
電話屋というのは音声中心で、計算機を使って音声を操作 しやすくなればよいと考えているようだが、計算機屋はマルチ メディアの一部としか考えていないのだろう。 Kamel氏が電話屋ということでどうも音声中心主義で、私のような 計算機屋とはかなり考え方が違うようである。分類法もなじまない。 大体テレマーケッティングなんてやってほしくない!

詳細 Wikiページ作成 関連カテゴリ: 音声

Carl R. Strathmeyer
Voice in Computing: An Overview of Available Technologies
IEEE Computer, Vol. 23, No. 8, pp. 10-15, August 1990

詳細 Wikiページ作成 関連カテゴリ: 音声

伊藤 克亘
音声対話システム
電子情報通信学会技術研究報告, Vol. 92, No. 125-127, pp. 23 - 30, June 1992

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

C. Schmandt
Conversational Telecommunications environments
Cognitive engineering in the design of human-computer interaction and expert systems: proceedings of the second international conference on human-computer interaction, Vol. 2, pp. 439-446, August 1987

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

伊福部 達
コミュニケーションエイドの生体工学的研究
情報処理学会ヒューマンインタフェース研究会研究報告 91-HI-39, Vol. 91, No. 39, pp. 1-6, November 1991
障害者用インタフェースのいろいろ。単音節音声タイプ ライタ(CQ出版の本のやつ)の紹介が出ている。

詳細 Wikiページ作成 関連カテゴリ: 音声

Chris M. Schmandt, Barry Arons
Phone Slave: A Graphical Telecommunications Interface
Proceedings of the Society of Information Display, Vol. 26, No. 1, pp. 79-82, 1985

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

平山 輝, 宮阪 信次, 橋本 美穂, 深谷 典行
連続音声認識に基づいたマンマシンインタフェースの構築方法

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

阪上 晃一, 勝俣 雅司
オーダエントリシステムにおける音声入力方式と ユーザインタフェースの評価
情報処理学会 マルチメディア通信と分散処理研究会 研究報告 89-DPS-43, September 1989
音声で商品オーダーを入力する場合の修正手法と評価。 複数の項目のうちいくつかだけ間違ったとき、その項目だけ 入力し直せるようにする。 認識率が変わると何度言いなおさなければならないとか 計算しているが、それがどうした?

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

浜田 洋, 千葉 仁一
音声メッセージ出力における強調の方法とその効果
文章内の一部を強調する音声合成器。強調のため、音量/速度 (遅くする)/ピッチ/ポーズで実験したら、速度/音量/ピッチ/ ポーズの順で強調を感じる。速度と音量を組みあわせると さらに良い。

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

J. M. Roemer, W. L. Pendley, M. O. Stempski, M. C. Borgstrom
Field Study Of A Voice Mail System: Design And Design-Process Implications
SIGCHI Bulletin, Vol. 18, No. 2, pp. 60-61, October 1986

詳細 Wikiページ作成 関連カテゴリ: 音声

Richard Halstead-Nussloch
The Design of Phone-Based Interfaces for Consumers
Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI'89), pp. 347-352, May 1989
電話をインタフェースに使う(Phone-Based Interaction:PBI) ときのガイドラインについて。 ○ 電話の特徴 ・音声入出力しかできない ・どこにでもある ○ 電話のインタフェース ・入力:キーパッドまたは音声 出力:録音音声または合成音声 ・対話型式(プロンプトの方法、対話の構造、...)の設計がむずかしい ○ Self Help: 電話による計算機のガイダンスシステム ○ 入力 音声認識では以下の条件が満たされるところのでないと使えない (本当か?異論がありそう)ので、電話のキーパッドをもっぱら使用 することにする。 ・目または手が使えること ・特定話者 ・トレーニングの時間が充分あること ・語彙が小さいこと ・静かなところで使われること ・認識を間違っても被害が少ないこと ・間違いをみつけるのと訂正するのが簡単なこと ○ 出力 可能なかぎり録音音声を使うのがよい 合成音声を使うときは、 ・メニューを示す場合は、示される単語についてユーザが 前もって知っていることが必要 ・ユーザをあらかじめ合成音声に慣らせておく ・ユーザが合成音声の抑揚に慣れるようにするため、最初に 冗長な文句を付加しておく。 ○ 対話方式の選択 ・コマンドベースとプロンプトベースの2種類が可能。 ・コマンドベース 以下のようなとき使うのがよい(c.f. SFS[4]) ・モード数が少ない(4ー5) ・モード内では多くの機能がある ・ちょくちょくモードを移動する ・そのPBIがよく使われる ・プロンプトベース 以下のような場合に使う。Self Helpはこちらの場合に属する。 ・モードが多い(6以上) ・モード内の構造は単純 ・モードの移動があまり行なわれない ・PBIがたまにしか使われない ○ プロンプト ・初心者には詳しい音声メニューを使い、熟練者には何も言わ なくてよい ・熟練者の場合でも、メッセージの途中で割り込み可能ならば 音声メニュー方式でも問題ない。 ・音声メニューはメニューのタイトル、選択枝、終了メッセージ で構成する。タイトルによって自分が今どこにいるのかを知らせる。 ・「To do function X, enter Y」というメッセージを使う。 ("Enter Y for function X"とはしない。日本語なら自然にこう なるだろう。) ・初心者にとっては音声メニュープロンプト方式が一番である。 ○ メッセージでシステムの状態を知らせる。 ○ ユーザに選択させるとき、よく使われるものは最初に出す (あたりまえ?) ○ 音声認識が便利な点 →CHI87のパネル[2]を参照
・こういう電話インタフェースだと盲人でも使えるはず。 ・それにしてもこんなあたりまえのような話が論文になる? ・米国の大きな会社に電話するとこの手の音声メニューで応答 されることがある。(ヨセミテに宿を予約しようと思ったら 全然つながらないうえにやっとつながったと思ったらこの手の 電話で応対されてしまった。メッセージがわかりにくいのを我慢 してやっと予約デスクまでたどりついたと思ったら「満室です」の ひとこと。Fuck you! 最初から人間が応対せい!) ・確かにどこのシステムも「To do something, press X」とは 言っていた。だからといって嬉しくも何ともないが。 ・銀行の「Bank by Phone」というシステムを時々使っていた。 預金残高が電話で調べられて便利。音声メッセージ+キーパッド で操作するが、熟練者は最初からメッセージを無視して コマンドをバシバシ入力して一度で目的の応答を得ることが できるので結構便利だった。(国際電話でも使えるのかしら)

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声 CHI89発表論文

新田 恒雄, 正井 康之, 岩崎 淳一, 田中 信一, 神尾 広幸, 原 義幸, 松浦 博, 中山 昭, 八尾 正博, 小野木 智宏
自由発話音声入力と直指(直接指示)を利用した マルチモーダル対話システムの検討
電子情報通信学会技術研究報告, Vol. 92, No. 409,410, pp. 37-42, January 1993

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

J. D. Gould, S. J. Boies
Human Factors Challenges in Creating a Principal Support Office SYstem -- The Speech Filing System Approach
ACM Transactions on Office Information Systems, Vol. 1, No. 4, pp. 273-298, October 1983

詳細 Wikiページ作成 関連カテゴリ: 音声

Ryohei Nakatsu
Anser -- An Application of Speech Technology to the Japanese Banking Industry
IEEE Computer, Vol. 23, No. 8, pp. 43-48, August 1990
銀行業務を電話でできるようにした実験らしい

詳細 Wikiページ作成 関連カテゴリ: 音声

藤本 真, 二木 泰治, 前原 文雄
音声合成器によるマルチメディアインターフェイス用 Voice Serverの検討

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

森本 一成, 門脇 久, 森本 直樹, 西村 武
音声によるポインティング操作に関する検討
計測自動制御学会 第19回ヒューマン・インタフェース研究会, Vol. 7, No. 2, April 1992

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

G. Franz, J. Reimer, W. Wotiz
Julie: The Application of DSP to a Consumer Product
Speech Technology, Vol. 4, No. 3, pp. 82-86, 1988

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

竹林 洋一
マルチメディアによる計算機との対話
電子情報通信学会技術研究報告, Vol. 92, No. 125-127, pp. 15-22, June 1992

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Alistair D. N. Edwards
Soundtrack: An Auditory Interface for Blind Users
Human-Computer Interaction, Vol. 4, No. 1, pp. 45-66, 1989
SoundTrack = Mac上の盲人用テキストエディタ ・マウスで音声フィードバック付きの階層的メニューを操作する。 ・画面に大きなブロックで「Document」「File」「Edit」など Macで使われるようなメニューが表示されており、マウスが その上に行くとメニューによりピッチの異なる音がする。 クリックするとそれが何であるか音声で読みあげられ、ダブル クリックすると次のレベルのメニューが出る(「Edit」を選択 すると「Copy」「Paste」などが出る)。 ・「Document」「New」を選択すると文書作成が可能になる。 ・文書作成中に入力した単語は読みあげられる。 ・文書は階層的になっておりレベルを上下左右に移動する。 ・「Thumb Bar」というスライダで文書内を移動できる。 ・例えば単語を消去するには、まず単語を選択し、編集メニュー を選択し、消去メニューを選択する。(大変そう!!)
・PhD Thesisの抄録だそうである。やれやれ。 ・何故無理してメニューやスライダなどを動かさなければなら ないのか。全然違うインタフェースにすべきでは。 ・盲人にとって画面の折り返しとか画面上の位置とかは意味が あるか?見えない画面上をマウスとかで移動させてどうしようと いうのだろうか。 ・Editメニューを選んでからCopyメニューを選ぶなど愚の骨頂 である。最初から「Copy」と言えばいいではないか! ・大体ポインティングデバイスなんて不要ではないのか。 ・盲人はペンを操作するのに慣れているとは考えられないが? だからタブレットが使えないのでは? ・マルチモーダルかつ冗長なインタフェースが必要だという 点は同意する。 ・盲人は読みでサーチするのだろうか?そういうエディタも 提案してた人がいた。

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

Lisa J. Stifelman, Barry Arons, Chris Schmandt, Eric A. Hulteen
VoiceNotes: A Speech Interface for a Hand-Held Voice Notetaker
Proceedings of ACM INTERCHI'93 Conference on Human Factors in Computing Systems (CHI'93), pp. 179-186, April 1993
Degen_MarkerTapeをテレコを使わず全て音声だけで 操作できるようにしたシステム。命令もAckも音声で行なわれる。 これでなんとか階層的に(カテゴリ分けなどして)音声データを 機械に格納しようとしているが、現在どのモードにいるのか わからなくなってユーザが混乱することもあるという。
Schmandt氏はPhoneSlave(Schmandt_Illusion参照) などといった(割としょうもない)音声IFをずっと研究している ようである。

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI93発表論文 ユーザインタフェース全般

Richard F. Dillon, Jeff D. Eday, Jo W. Tombaugh
Measuring the True Cost of Command Selection: Techniques and Results
Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI'90), pp. 19-25, April 1990
画面上の点をつなぐという仕事をするのに、マウスとメニュー を使う場合と音声を使う場合とどちらが速かったか実験した、 とかいうだけの話。それがどうした??

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般 CHI90発表論文

Chris M. Schmandt, E. A. Hulteen
The Intelligent Voice-Interactive Interface
Proceedings os Human Factors in Computing Systems, pp. 363-366, March 1982

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Leo Degen, Richard Mander, Gitta Salomon
Working with Audio: Integrating Personal Tape Recorders and Desktop Computers
Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI'92), pp. 413-418, May 1992
テープレコーダを改造して、テープにマーキングができる ようにした。時々ユーザがマークボタンを押すことにより 片チャネルに特殊信号が録音され、それを後で検索できる ようになっている。

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI92発表論文

Jeremy B. Peckham
Automatic Speech Recognition -- A Solution in Search of a Problem?
Behaviour and Information Technology, Vol. 3, No. 2, pp. 145-152, 1984
音声認識技術の現状・有効なマンマシンインターフェイスの 構築と音声認識との関係・音声認識技術をうまく活用している アプリケーションの特徴について述べている。 ● 企業は音声IF製品に熱心だが実際の要求は高くない ● 音声IFがうまくいくかどうかは音声処理技術と仕事の内容が マッチしていることが大事である ● データ入力では音声入力が有効なことがある ● 手や目が忙しいときに音声入力は有効である ● 音声ダイヤラーは有効である ● 対話IFの設計が重要である。プロンプト・構文解析・フィード バック・編集方法・出力バッファ処理・ヘルプ・トレーニング 手法などに注意した対話設計ツールが必要である。 ● ユーザが音声入力を使いたいと思っており、多少のトレー ニング期間を受け入れ、また音声により仕事が効率化した ことを実感できるような場合に音声IFはうまくいく。

詳細 Wikiページ作成 関連カテゴリ: ユーザインタフェース全般 音声

Paul Brennan, Gerhard Deffner, Debbie Lawrence, Monica Marics, Eileen Schwab, Marita Franzke
Should We or Shouldn't We Use Spoken Commands in Voice Interfaces?
Proceedings of the ACM Conference on Human Factors in Computing Systems (CHI'91), pp. 369-372, April 1991
電話の音声インタフェースについてのパネル ○ Debbie Lawrence (NYNEX,音声ダイアラーサービス) ・役にたつ ・システムが認識に失敗したときユーザはゆっくり喋ったり 大きな声で喋ったりするが、こうするとかえって認識が悪くなる ・「Robert」で登録しておいて「Bob」とか言う奴がいる ・よくある名前の方が認識しやすいと勘違いする奴がいる ○ Gerhard Deffner (TI,ボイスメール) ・ユーザは音声コマンドは使わないが数字読みあげは使う。 ○ Monica A. Marics (Bell) ・音声インタフェースが使われないのは認識率の問題ではない。 ・勝手に「Please」をつけ足したり自然言語でしゃべる奴がいる ・「Yes」のかわりに「Okay」という奴もいる ・プロンプトのトーン音を待たずにしゃべり出す奴もいる ・自然言語認識が欲しいところである ○ Marita Franzke (U S West,ボイスメール) ・タッチトーンでやるより音声で指示する方が意外と速い ・音声認識はタッチトーンよりエラー率は高いが、別の仕事と 同時にやらせると逆に音声指示の方がエラーが少なくなる ・主観評価では音声指示を好む人の方が多い ・自然言語処理なんか適当で良い

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI91発表論文

中谷 吉久, 守屋 慎次
文書編集における音声制御の一方式とその評価

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Lalit R. Bahl, Peter F. Brown, Peter V. DeSouza, Robert L. Mercer
A Tree-Based Statistical Language Model for Natural Language Speech Recognition
IEEE Transactions on Acoustics, Speech, and Signal Processing, Vol. 37, No. 7, pp. 1001-1008, July 1989

詳細 Wikiページ作成 関連カテゴリ: 音声 データ圧縮

M. M. Taylor, F. Neel, D. G. Bouwhuis
North-Holland, Amsterdam, 1989

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

A. Aucella, S. F. Ehrlich
Voice Messaging: Enhancing The User Interface Based On Field Performance
Proceedings of the CHI'86 Conference on Human Factors in Computing Systems and Graphic Interfaces, pp. 156-161, May 1986

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI86発表論文 ユーザインタフェース全般

阪上 晃一, 勝俣 雅司
音声入力のための会話モデルの提案とユーザインタフェースの評価

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

A. Aucella, R. Kinkead, C. Schmandt, A. Wichansky
Voice: Technology Searching for Communication Needs
Proceedings of the CHI + GI '87 Conference on Human Factors In Computing Systems and Graphic Interfaces, pp. 41-44, April 1987

詳細 Wikiページ作成 関連カテゴリ: 音声 CHI87発表論文 ユーザインタフェース全般

David Visick, Peter Johnson, John Long
The Use of Simple Speech Recognisers in Industrial Applications
Proceedings of IFIP INTERACT'84: Human-Computer Interaction, pp. 209-213, 1984

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般

Barry Arons
Hyperspeech
Proceedings of ACM INTERCHI'93 Conference on Human Factors in Computing Systems (CHI'93), pp. 524, April 1993

詳細 Wikiページ作成 関連カテゴリ: 音声 ユーザインタフェース全般 CHI93発表論文 ユーザインタフェース全般

中川 聖一
確率モデルによる音声認識
電子情報通信学会, 1988

詳細 Wikiページ作成 関連カテゴリ: データ圧縮 音声

Chris Schmandt, Mark S. Ackerman, Debby Hindus
Augmenting a Window System with Speech Input
IEEE Computer, Vol. 23, No. 8, pp. 50-56, August 1990
Xspeakは音声でXウィンドウのウィンドウ操作を実現する。 ウィンドウ名を呼ぶとそのアプリが(見えない場合でも)前面に 出てくる。結果は以下のとおり。 ・ヘッドセットを使っていないので認識率が悪い。50-80%程度 ・特に音声インタフェースは好まれない。 ・隠れたウィンドウの選択は速い ・ウインドウ操作の上手な人には役にたたない ・マウス操作全部を音声でできるわけではない ということで、Xのイベントマクロ言語のようなものを作って あらゆるマウス操作を音声でできるようにしたXspeakIIを作った。 ・コンテキスト依存認識 ・イベント記述言語X-GL
・イベント記述言語は繰返しや条件も書くことができるが、音声 とは全然関係がない! ・音声合成についてはどう考えているのだろうか ・とにかく全然便利そうでない!「Simon says」は便利だと いうけれど...

詳細 Wikiページ作成 関連カテゴリ: 音声