Researcher Database

Researcher Profile and Settings

Master

Affiliation (Master)

  • Faculty of Information Science and Technology Media and Network Technologies Information Media Science and Technology

Affiliation (Master)

  • Faculty of Information Science and Technology Media and Network Technologies Information Media Science and Technology

researchmap

Profile and Settings

Degree

  • Doctor of Engineering(Hokkaido University)
  • Master of Engineering(Hokkaido University)

Profile and Settings

  • Name (Japanese)

    Aoki
  • Name (Kana)

    Naofumi
  • Name

    200901029208985252

Alternate Names

Achievement

Research Interests

  • 言語療法   福祉工学   音響学   音楽療法   コンピュータミュージック   外国語教育   ステガノグラフィ   電子透かし   音声データベース   音声分析   音声合成   電子回路   ディジタル信号処理   音声学   Humanoid Agent   Cyber Space   Network Computing   Internet Telephony   Facial Recognition   Facial Animation   Music Therapy   Sound Effect Database   Computer Music   Musical Instruments Information Processing   Foreign Language Education   Steganography   Watermarking   Speech Database   Speech Analysis   Speech Coding   Speech Synthesis   Electronic Circuit   Digital Signal Processing   Analog Signal Processing   Acoustics   Linguistics   

Research Areas

  • Manufacturing technology (mechanical, electrical/electronic, chemical engineering) / Communication and network engineering
  • Humanities & social sciences / Educational technology
  • Informatics / Information theory

Awards

  • 2004 FIT情報科学技術フォーラムヤングリサーチャー賞
  • 2001 電気関係学会北海道支部連合大会若手講演者賞

Published Papers

  • Designing Synchronization Patterns Minimizing the Latency and the Computational Complexity for Inaudible Sound Communication Systems
    Naofumi Aoki, Kosei Ozeki, Kenichi Ikeda, Hiroshi Yasuda, Hiroyuki Namba
    IEICE Communications Express (ComEX), Special Cluster in Emerging Communication Technologies in Conjunction with Main Topics of ICETC2022 12 (8) 392 - 397 2023/12 [Refereed][Not invited]
  • Research on Machine Learning Model for Detecting Ultrasonic Signals
    Kosei Ozeki, Naofumi Aoki, Yoshinori Dobashi
    2023 International Conference on Emerging Technologies for Communications (ICETC 2023) p3-23 2023/11 [Refereed][Not invited]
  • Just intonation is better than equal temperament for transmitting melodic messages in sound communication
    Naofumi Aoki, Kosei Ozeki, Kenichi Ikeda, Hiroshi Yasuda, Hiroyuki Namba
    2023 International Conference on Emerging Technologies for Communications (ICETC 2023) p1-4 2023/11 [Refereed][Not invited]
  • FDTD法による頭部伝達関数の音響シミュレーションにおける空間解像度に関する一検討
    蠣崎 一裕, 青木 直史, 土橋 宜典, 元木 邦俊
    電子情報通信学会技術研究報告応用音響研究会資料 EA2023-8 2023/07 [Not refereed][Not invited]
  • スペクトログラム画像を用いた病的音声のスクリーニングにおけるCNNモデルとCRNNモデルの性能比較
    青木 直史, 全 慶樹
    電子情報通信学会技術研究報告応用音響研究会資料 EA2023-7 2023/07 [Not refereed][Not invited]
  • 1947年に出版された文献「Visible Speech」に残されているスペクトログラム画像からの音声復元
    青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2023-6 2023/07 [Not refereed][Not invited]
  • ドラムパターンを用いた楽曲ジャンル分類に関する一検討
    荒 尭志, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2023-5 2023/07 [Not refereed][Not invited]
  • A survey of an inverse halftoning technique toward speech restoration of printed spectrogram images
    Naofumi Aoki
    Acoustical Science and Technology 44 (4) 336 - 339 2023/04 [Refereed]
  • Technique of improving speech restoration from spectrograms of short windows for the Griffin-Lim algorithm
    Naofumi Aoki
    Acoustical Science and Technology 44 (3) 186 - 188 2023/03 [Refereed][Not invited]
  • オイラーグラフ系列にもとづく非可聴音波通信のためのホッピングパターンの設計に関する一検討
    青木 直史, 尾関 剛成, 池田 研一, 安田 寛, 難波 弘行
    電子情報通信学会技術研究報告応用音響研究会資料 EA2022-80 2023/02 [Not refereed][Not invited]
  • Automatic generation of stage data for music games with sparse target density
    Atsuhito Udo, Naofumi Aoki, Yoshinori Dobashi
    Acoustical Science and Technology 44 (2) 49 - 57 2023/02 [Refereed][Not invited]
  • 「聴覚心理学」を知ってもらう活動
    竹内 京子, 青木 直史, 荒井 隆行, 鈴木 恵子, 世木 秀明, 秦 若菜, 安 啓一
    日本音響学会音声コミュニケーション研究会・聴覚研究会合同研究会 H-2023-5 2023/01 [Not refereed][Not invited]
  • Some Evaluations on Spectrogram Art Communications Exchanging Secret Visual Messages
    Naofumi Aoki, Kenichi Ikeda, Hiroshi Yasuda, Ying Shen, Jin Hou
    2022 6th International Conference on Digital Signal Processing (ICDSP 2022) FE1005 73 - 77 2022/12 [Refereed][Not invited]
  • Designing Synchronization Patterns Based on Euler Graphs for Inaudible Sound Communication Systems
    Naofumi Aoki, Kosei Ozeki, Kenichi Ikeda, Hiroshi Yasuda, Hiroyuki Namba
    2022 International Conference on Emerging Technologies for Communications (ICETC 2022) s11-7 2022/11 [Refereed][Not invited]
  • インタラクティブ音声合成システム``Voice Pad''を利用した言語聴覚士のための音響教育の可能性
    後藤 大樹, 青木 直史, 藍 圭介, 元木 邦俊
    日本音響学会誌 78 (10) 557 - 565 2022/10 [Refereed]
  • Crest factor reduction of spectrogram art signals based on clipping and filtering processes
    Naofumi Aoki, Kenichi Ikeda, Sio Tanba, Hiroshi Yasuda
    IEICE Communications Express (ComEX), Special Cluster in Emerging Communication Technologies in Conjunction with Main Topics of ICETC2021 11 (8) 480 - 484 2022/08 [Refereed][Not invited]
  • 音通信技術の開発と実際
    池田 研一, 安田 寛, 難波 弘行, 青木 直史, 尾関 剛成
    電子情報通信学会技術研究報告応用音響研究会資料 EA2022-24 2022/07 [Not refereed][Invited]
  • FDTD法によるHRTF推定における耳介モデルの解像度に関する一検討
    蠣崎 一裕, 青木 直史, 土橋 宣典, 元木 邦俊
    電子情報通信学会技術研究報告応用音響研究会資料 EA2022-23 2022/07 [Not refereed][Not invited]
  • 超音波信号の音響イベント検出システムの検討
    尾関 剛成, 青木 直史, 土橋 宜典, 池田 研一, 安田 寛
    電子情報通信学会技術研究報告応用音響研究会資料 EA2022-22 2022/07 [Not refereed][Not invited]
  • フルスクラッチ合成による楽器音の音響合成
    青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2022-15 2022/07 [Not refereed][Not invited]
  • 言語聴覚士養成校の聴覚心理学
    竹内 京子, 青木 直史, 荒井 隆行, 鈴木 恵子, 世木 秀明, 秦 若菜, 安 啓一
    日本音響学会音声コミュニケーション研究会・聴覚研究会合同研究会 SC-2022-7 2022/01 [Not refereed][Not invited]
  • Acoustic Event Detection of Ultrasonic Signals for Inaudible Sound Communications Using CNN
    Kosei Ozeki, Naofumi Aoki, Yoshinori Dobashi
    2021 International Conference on Emerging Technologies for Communications (ICETC 2021) P2-7 2021/12 [Refereed][Not invited]
  • Crest Factor Reduction of Spectrogram Art Signals by Using an Audio Clipping Technique
    Naofumi Aoki, Kenichi Ikeda, Hiroshi Yasuda
    2021 International Conference on Emerging Technologies for Communications (ICETC 2021) P2-17 2021/12 [Refereed][Not invited]
  • Improving the recognition accuracy of a sound communication system designed with a neural network
    Kosei Ozeki, Naofumi Aoki, Saki Anazawa, Yoshinori Dobashi, Kenichi Ikeda, Hiroshi Yasuda
    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences E104-A 2021/11 [Refereed][Not invited]
  • 話者依存の音響モデルの作成におけるサンプル数の比較と検討
    成田 圭吾, 青木 直史, 有働 篤人, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2021 (16) 2021/07 [Not refereed][Not invited]
  • 音声合成のためのオンラインによる音声データ収集に関する一検討
    星子 祐哉, 青木 直史, 尾関 剛成, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2021 (15) 2021/07 [Not refereed][Not invited]
  • DIYによる「声帯模型」制作記
    青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2021 (11) 2021/07 [Not refereed][Not invited]
  • 深層学習による超音波信号分類システムの開発
    尾関 剛成, 青木 直史, 土橋 宜典, 池田 研一, 安田 寛
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (21) 2021/06 [Not refereed][Not invited]
  • インタラクティブ音声合成システムにおけるガイドラインの動的表示
    後藤 大樹, 青木 直史, 藍 圭介, 元木 邦俊
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (18) 2021/06 [Not refereed][Not invited]
  • ディジタルパターンプレイバックにおける摩擦判定についての一検討
    大竹 裕季, 青木 直史, 尾関 剛成, 土橋 宜典
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (13) 2021/06 [Not refereed][Not invited]
  • 音響モデル精度向上のための誤り訂正に関する一検討
    穴沢 早紀, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (12) 2021/06 [Not refereed][Not invited]
  • 機械学習を用いた歪みエフェクタのデジタルモデリングの高精度化
    松永 悠斗, 青木 直史, 土橋 宜典, 小嶋 徹也
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (11) 2021/06 [Not refereed][Not invited]
  • 機械学習を用いたリズムゲームのステージデータの自動生成の検証
    有働 篤人, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (10) 2021/06 [Not refereed][Not invited]
  • パーソナライズされた音声合成のための日本語音素バランス文作成
    髙井 佑洸, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (9) 2021/06 [Not refereed][Not invited]
  • 作ればわかる! ゼロからはじめるディジタルエフェクタのサウンドプログラミング
    青木 直史
    電子情報通信学会技術研究報告応用音声研究会資料 SP2021 (3) 2021/06 [Not refereed][Not invited]
  • Yuto Matsunaga, Naofumi Aoki, Yoshinori Dobashi, Tetsuya Kojima
    IEEE The 3rd International Conference on Artificial Intelligence in Information and Communication 2021 (ICAIIC2021) 31 - 35 2021/04 [Refereed][Not invited]
  • Possibilities of Visual Communications Using Additive and Subtractive Spectrogram Arts
    Naofumi Aoki, Saki Anazawa, Kosei Ozeki, Yoshinori Dobashi, Kenichi Ikeda, Hiroshi Yasuda
    2020 International Workshop on Smart Info-Media Systems in Asia (SISA2020) 133 - 137 2020/12 [Refereed][Not invited]
  • Examination of Improving Machine-Made Charts for Music Game Generated by a Deep Neural Network
    Naofumi Aoki, Saki Anazawa, Kosei Ozeki, Yoshinori Dobashi
    2020 International Workshop on Smart Info-Media Systems in Asia (SISA2020) 30 - 34 2020/12 [Refereed][Not invited]
  • A Synchronization Technique Using De Bruijn Sequences for Inaudible Sound Communication Systems
    Naofumi Aoki, Kenichi Ikeda, Hiroshi Yasuda
    2020 International Conference on Emerging Technologies for Communications (ICETC 2020) P2 (4) 2020/12 [Refereed][Not invited]
  • Evaluation on the Recognition Accuracy of an Inaudible Sound Communication System in Real Environments
    Kosei Ozeki, Naofumi Aoki, Saki Anazawa, Yoshinori Dobashi, Kenichi Ikeda, Hiroshi Yasuda
    2020 International Conference on Emerging Technologies for Communications (ICETC 2020) P2 (3) 2020/12 [Refereed][Not invited]
  • Digitizing Text Messages Exchanged in Spectrogram Arts Communications by Using an Optical Characters Reader
    Saki Anazawa, Naofumi Aoki, Kosei Ozeki, Yoshinori Dobashi, Kenichi Ikeda, Hiroshi Yasuda
    2020 International Conference on Emerging Technologies for Communications (ICETC 2020) N1 (4) 2020/12 [Refereed][Not invited]
  • 歪み回路の機械学習ベースモデリングにおける受容野に関する一考察
    松永 悠斗, 青木 直史, 土橋 宜典, 小嶋 徹也
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (33) 2020/11 [Not refereed][Not invited]
  • Designing a symbol classifier for inaudible sound communication systems using a neural network
    Kosei Ozeki, Naofumi Aoki, Saki Anazawa, Yoshinori Dobashi, Kenichi Ikeda, Hiroshi Yasuda
    International Symposium on Information Theory and its Applications (ISITA2020) 569 - 572 2020/10 [Refereed][Not invited]
  • Pythonによるディジタルパターンプレイバックの実装
    大竹 裕季, 青木 直史, 尾関 剛成, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (12) 2020/07 [Not refereed][Not invited]
  • インタラクティブ音声合成システム「Voice Pad」におけるゲーミフィケーションの可能性
    後藤 大樹, 青木 直史, 藍 圭介, 元木 邦俊
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (11) 2020/07 [Not refereed][Not invited]
  • Pythonによるサウンドプログラミングの可能性
    青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (8) 2020/07 [Not refereed][Invited]
  • ユーザーの要求に適した日本語音素バランス文作成に関する一検討
    髙井 佑洸, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (6) 2020/07 [Not refereed][Not invited]
  • U-Netを用いた非可聴音通信システムにおける雑音低減に関する一検討
    穴沢 早紀, 青木 直史, 尾関 剛成, 土橋 宜典, 池田 研一, 安田 寛
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (3) 2020/07 [Not refereed][Not invited]
  • 機械学習による非可聴音通信システムにおける信号音識別に関する一検討
    尾関 剛成, 青木 直史, 穴沢 早紀, 土橋 宜典, 池田 研一, 安田 寛
    電子情報通信学会技術研究報告応用音響研究会資料 EA2020 (1) 2020/07 [Not refereed][Not invited]
  • Development of an inaudible sound communications system based on a machine learning approach
    Kosei Ozeki, Naofumi Aoki, Yoshinori Dobashi
    IEEE The 2nd International Conference on Artificial Intelligence in Information and Communication 2020 (ICAIIC2020) 79 - 83 2020/02 [Refereed][Not invited]
  • A black box modeling technique for distortion stomp boxes using LSTM neural networks
    Yuto Matsunaga, Naofumi Aoki, Yoshinori Dobashi, Tetsuya Kojima
    IEEE The 2nd International Conference on Artificial Intelligence in Information and Communication 2020 (ICAIIC2020) 653 - 656 2020/02 [Refereed][Not invited]
  • A study on automatic music genre classification based on the summarization of music data
    Yudai Kikuchi, Naofumi Aoki, Yoshinori Dobashi
    IEEE The 2nd International Conference on Artificial Intelligence in Information and Communication 2020 (ICAIIC2020) 705 - 708 2020/02 [Refereed][Not invited]
  • Web上に投稿された動画と字幕データによる音声データベース構築
    高井 佑洸, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (22) 2019/07 [Not refereed][Not invited]
  • Juliusによる音声データベースのセグメンテーションに関する一考察
    穴沢 早紀, 青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (21) 2019/07 [Not refereed][Not invited]
  • インタラクティブ音声合成システム「Voice Pad」における無声子音の合成について
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (20) 2019/07 [Not refereed][Not invited]
  • 特徴量に基づいた楽曲の自動要約に関する一検討
    菊池 雄大, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (19) 2019/07 [Not refereed][Not invited]
  • トライアングルの音響分析と音響合成
    青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (18) 2019/07 [Not refereed][Not invited]
  • デジタルエフェクタ評価ボードの開発
    買手 健太, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (4) 2019/07 [Not refereed][Not invited]
  • 機械学習を用いた歪みエフェクタのブラックボックスモデリング
    松永 悠斗, 青木 直史, 土橋 宜典, 小嶋 徹也
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (3) 2019/07 [Not refereed][Not invited]
  • リズムゲームの譜面データの機械学習による自動生成
    有働 篤人, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (2) 2019/07 [Not refereed][Not invited]
  • ニューラルネットワークによる非可聴域における音通信に関する一考察
    尾関 剛成, 青木 直史, 土橋 宜典
    電子情報通信学会技術研究報告応用音響研究会資料 EA2019 (1) 2019/07 [Not refereed][Not invited]
  • Some evaluations on a digital watermarking technique for music data using distortion effect
    MATSUNAGA Yuto, KOJIMA Tetsuya, AOKI Naofumi, DOBASHI Yoshinori, YAMAMOTO Tsuyoshi
    IEICE Transactions on Information and Systems E102-D (6) 1119 - 1125 2019/06 [Refereed][Not invited]
  • Evaluation of machine-made scores for music games generated by a deep neural network
    UDO Atsuhito, AOKI Naofumi, DOBASHI Yoshinori, YAMAMOTO Tsuyoshi
    IEEE The 1st International Conference on Artificial Intelligence in Information and Communication 128 - 131 2019/02 [Refereed][Not invited]
  • インタラクティブ音声合成システム「Voice Pad」の開発
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2018 (87) 2019/01 [Not refereed][Not invited]
  • システムトレードにおけるパラメータ検討のためのビジュアライゼーション
    須藤 健次, 青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2018 (82) 2019/01 [Not refereed][Not invited]
  • メイカームーブメントを楽しむヒント
    青木 直史, 葛西 紘貴, 井上 育美, 辻 順平
    電子情報通信学会技術研究報告メディアエクスペリエンス・バーチャル環境基礎研究会資料 MVE2018 (32) 2018 [Not refereed][Not invited]
  • 狸小路商店街のストリートビュー生成に関する一考察
    安田 星季, 堀 武司, 青木 直史
    電子情報通信学会技術研究報告メディアエクスペリエンス・バーチャル環境基礎研究会資料 MVE2018 (28) 2018 [Not refereed][Not invited]
  • 視線コントロールによる実世界インタフェースの可能性
    元由 勝人, 青木 直史
    電子情報通信学会技術研究報告メディアエクスペリエンス・バーチャル環境基礎研究会資料 MVE2018 (26) 2018 [Not refereed][Not invited]
  • 手品のトリックにみる情報ハイディングのヒント
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2018 (31) 2018 [Not refereed][Not invited]
  • リズムゲームの譜面データの機械学習による自動生成
    有働 篤人, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2018 (27) 2018 [Not refereed][Not invited]
  • LSTM機械学習を用いた歪みエフェクタのデジタルモデリング
    松永 悠斗, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2018 (26) 2018 [Not refereed][Not invited]
  • インタラクティブ音声合成システムによる言語聴覚士のための音響教育
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告応用音響研究会資料 EA2018 (24) 2018 [Not refereed][Not invited]
  • クロマベクトルを用いた和音推定の精度検証
    買手 健太, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2018 (5) 2018 [Not refereed][Not invited]
  • 楽曲の特徴量に基づいた楽曲内部の類似度の計算に関する一検討
    菊池 雄大, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2018 (4) 2018 [Not refereed][Not invited]
  • 歪みエフェクトを用いた音響電子透かしの改良
    松永 悠斗, 小嶋 徹也, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2017 (76) 2018 [Not refereed][Not invited]
  • 汎用PCにおける音波を用いたジェスチャ検出の応用
    有働 篤人, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2017 (73) 2018 [Not refereed][Not invited]
  • 身体障害者のためのQoLプログラミング
    青木 直史, 元由 勝人
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2017 (72) 2018 [Not refereed][Not invited]
  • リズムおよび音色の変化による楽曲の分割に関する一検討
    菊池 雄大, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2017 (70) 2018 [Not refereed][Not invited]
  • A digital modeling technique for distortion effect based on a machine learning approach
    MATSUNAGA Yuto, AOKI Naofumi, DOBASHI Yoshinori, YAMAMOTO Tsuyoshi
    APSIPA Annual Summit and Conference 2018 [Refereed][Not invited]
  • Naofumi Aoki
    Smart Innovation, Systems and Technologies 82 161 - 168 2190-3026 2018 [Refereed][Invited]
     
    Information hiding technique is in general employed for practical applications such as steganography and watermarking. Although the mainstream of the researches on information hiding technique focuses on these practical applications, entertainment usage such as in trick arts may also be within its scope. This paper describes an idea of making audio trick art based on the concept of information misreading technique that retrieves multiple information from identical data by changing the format of data interpretation.
  • Yuto Matsunaga, Tetsuya Kojima, Naofumi Aoki, Yoshinori Dobashi, Tsuyoshi Yamamoto
    Acoustical Science and Technology 39 (1) 37 - 39 1347-5177 2018 [Refereed][Not invited]
  • Yuto Matsunaga, Tetsuya Kojima, Naofumi Aoki, Yoshinori Dobashi, Tsuyoshi Yamamoto
    2017 8th International Workshop on Signal Design and Its Applications in Communications, IWSDA 2017 131 - 134 2017/11/03 [Refereed][Not invited]
     
    In this paper, we propose a novel concept of a digital watermark for music data that focuses on the use of sound effect techniques. This paper describes our proposed technique, which utilizes the distortion effect, frequently employed especially for guitar and bass instruments. In addition, this paper describes the experimental results of evaluating the robustness of the proposed technique against some basic attacks including MP3 coding, tempo alteration, and pitch alteration. It is demonstrated that the proposed technique potentially has good performance against such attacks.
  • [チュートリアル]ゼロからはじめるPure Dataによるサウンドプログラミング
    青木 直史
    日本音響学会音響教育研究会資料 9 (1) 25 - 32 2017 [Not refereed][Invited]
  • Pure Dataによるインタラクティブ音声合成システムの開発
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告メディアエクスペリエンス・バーチャル環境基礎研究会資料 MVE2017 (31) 2017 [Not refereed][Not invited]
  • [招待講演]音響教育におけるサウンドプログラミングの可能性
    青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2017 (25) 2017 [Not refereed][Invited]
  • 汎用PCにおける超音波を用いたジェスチャー検出に関する一検討
    有働 篤人, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2017 (18) 2017 [Not refereed][Not invited]
  • 適応信号処理を用いた非線形歪み回路のモデリングに関する一検討
    松永 悠斗, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2017 (17) 2017 [Not refereed][Not invited]
  • 音響信号のダイナミクスに基づいたテンポ推定に関する一検討
    菊池 雄大, 青木 直史, 土橋 宜典, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2017 (16) 2017 [Not refereed][Not invited]
  • 非可聴周波数を利用した音響アプリケーションに関する一考察
    青木 直史, 須田 祥平, 瀧上 雄大, 山上 晃平, 山本 強
    電子情報通信学会技術研究報告応用音響研究会資料 EA2017 (14) 2017 [Not refereed][Not invited]
  • Pure Dataによる音響教育の可能性
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2016 (74) 2017 [Not refereed][Not invited]
  • ポケモンGOに関する大学生の意識調査
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2016 (13) 2016 [Not refereed][Not invited]
  • Pure Dataによるサウンドプログラミングの可能性
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告応用音響研究会資料 EA2016 (14) 2016 [Not refereed][Not invited]
  • Pure Dataによるマルチメディアプログラミングの可能性
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2016 (17) 2016 [Not refereed][Not invited]
  • 北海道における「声を残す」プロジェクト
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2015 (72) 2016 [Not refereed][Not invited]
  • An interactive speech synthesizer for acoustic education developed with Pure Data
    AOKI Naofumi
    Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan 3315  2016 [Refereed][Invited]
  • An interactive speech synthesizer developed with Pure Data and Touch OSC
    AOKI Naofumi, AI Keisuke
    Joint 8th International Conference on Soft Computing and Intelligent Systems and 17th International Symposium on Advanced Intelligent Systems 371 - 372 2016 [Refereed][Invited]
  • メイカームーブメントを読み解くヒント
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2015 (22) 2015 [Not refereed][Not invited]
  • 食からリアリティを考える
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2014 (86) 2015 [Not refereed][Not invited]
  • エンタテインメントにおける情報ハイディングの可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2014 (66) 2015 [Not refereed][Not invited]
  • Audio trick art based on information misreading technique
    AOKI Naofumi
    International Symposium on Temporal Design in Architecture and Environment 2015 [Refereed][Invited]
  • Sound programming using MATLAB
    AOKI Naofumi
    International Workshop on Time Series Data Sonification 324  2015 [Refereed][Invited]
  • プロトタイピングから見たITエンジニア教育
    青木 直史, 葛西 紘貴, 井上 育美, 辻 順平
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2014 (32) 2014 [Not refereed][Not invited]
  • プロトタイピングによるエンタテインメントの創造
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2014 (5) 2014 [Not refereed][Not invited]
  • 量子化ビットのランダムシフトを利用した音声スクランブル法
    朱 治, 山本 克彦, 鵜木 祐史, 青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2013 (109) 2014 [Not refereed][Not invited]
  • 音響学教育のための教材開発
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2013 (88) 2014 [Not refereed][Not invited]
  • ZHU Zhi, YAMAMOTO Katsuhiko, UNOKI Masashi, AOKI Naofumi
    Journal of Signal Processing 信号処理学会 18 (6) 303 - 307 1342-6230 2014 [Refereed][Not invited]
     
    Speech scrambling aims to eliminate intelligibility of original speech in order to preventing eavesdropping and copyright infringement. There is, however, a problem in that completely recovering scrambled speech into the original speech cannot be achieved with conventional methods. In this paper, we propose a speech scrambling method that uses the random-bit-shift of quantization bits with common keys. We evaluated the confidentiality and efficiency of the proposed method by using two objective measures, SER and PESQ. As a result we confirmed that speech signals can be scrambled into completely unintelligible sounds with the proposed method. Moreover, it is possible to restore a scrambled speech signal into the original one completely. In addition, we also confirmed that the scrambled speech signal could not be descrambled correctly with the wrong key.
  • YAMAMOTO Katsuhiko, ZHU Zhi, UNOKI Masashi, AOKI Naofumi
    Journal of Signal Processing 18 (4) 205 - 208 2014 [Refereed][Not invited]
  • 音韻修復現象に着目した半開示音声スクランブル法の検討
    山本 克彦, 朱 治, 鵜木 祐史, 青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2013 (78) 2013 [Not refereed][Not invited]
  • 食のリアリティに関する一考察
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2013 (19) 2013 [Not refereed][Not invited]
  • 音響教育におけるサウンドプログラミングの可能性
    青木 直史, 藍 圭介
    電子情報通信学会技術研究報告応用音響研究会資料 EA2013 (43) 2013 [Not refereed][Not invited]
  • [パネル討論]情報セキュリティから見たITエンジニア教育
    青木 直史, 三谷 公美, 藤丸 真南海, 岸谷 隆久, 辻 順平, 高橋 知宏
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2013 (27) 2013 [Not refereed][Not invited]
  • [特別講演]音メディアに求められるクオリティ
    青木 直史
    電子情報通信学会技術研究報告コミュニケーションクオリティ研究会資料 CQ2013 (17) 2013 [Not refereed][Invited]
  • モノラル‐ステレオ変換によるオーディオトリックアートの可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2012 (110) 2013 [Not refereed][Not invited]
  • [パネル討論]ロードマップ作成から見えてきた情報処理研究分野の将来
    馬場口 登, 鈴木 陽一, 越前 功, 日置 尋久, 青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2012 (95) 2013 [Not refereed][Not invited]
  • Naofumi Aoki, Yota Morimoto
    Acoustical Science and Technology 34 (5) 342 - 343 1346-3969 2013 [Refereed][Invited]
  • 物語から生み出されるリアリティ
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2012 (38) 2012 [Not refereed][Not invited]
  • ソニフィケーション・ツールとしてのSuperCollider
    森本 洋太, 青木 直史
    電子情報通信学会技術研究報告応用音響研究会資料 EA2012 (50) 2012 [Not refereed][Not invited]
  • 情報ハイディングによる価値創造の可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2012 (10) 2012 [Not refereed][Not invited]
  • 標本化周波数の変更によるオーディオトリックアートの可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2011 (74) 2012 [Not refereed][Not invited]
  • Audio trick art: an entertainment application based on information hiding technique
    AOKI Naofumi
    International Technical Conference on Circuits/Systems, Computers and Communications 2012 [Refereed][Invited]
  • 情報ミスリーディングによるオーディオトリックアートの可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2011 (46) 2011 [Not refereed][Not invited]
  • ソーシャルメディアによる価値創造の可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2011 (31) 2011 [Not refereed][Not invited]
  • 仮想世界と現実世界をつなぐ価値創造の可能性
    青木 直史
    電子情報通信学会技術研究報告コミュニケーションクオリティ研究会資料 CQ2011 (18) 2011 [Not refereed][Not invited]
  • SuperColliderによるサウンドプログラミング
    青木 直史, 森本 洋太
    電子情報通信学会技術研究報告応用音響研究会資料 EA2011 (36) 2011 [Not refereed][Not invited]
  • EMMが目指すマルチメディア情報処理の未来
    西村 明, 越前 功, 西村 竜一, 新見 道治, 日置 尋久, 青木 直史
    電子情報通信学会技術研究報告マルチメディア情報ハイディング・エンリッチメント研究会資料 EMM2011 (7) 2011 [Not refereed][Not invited]
  • Naofumi Aoki
    Proceedings - 7th International Conference on Intelligent Information Hiding and Multimedia Signal Processing, IIHMSP 2011 306 - 309 2011 [Refereed][Invited]
     
    Information hiding technique is employed for some practical applications such as steganography and digital watermarking. Besides these applications, trick art may also be categorized as an application of information hiding technique. This paper describes some examples of trick art. Also, based on the concept named information misreading technique, this paper newly introduces a methodology of making trick art for audio information. © 2011 IEEE.
  • Naofumi Aoki
    IEICE TRANSACTIONS ON COMMUNICATIONS E93B (3) 729 - 731 0916-8516 2010/03 [Refereed][Not invited]
     
    This study investigates a band extension technique for narrow-band telephony speech The proposed technique employs full wave rectification that nonlinearly generates high-band overtones from the low band In order to improve the conventional technique. this study investigates a frame-by-frame gain control based on the estimation of gain parameter front narrow-band telephony speech A subjective evaluation indicates that the proposed technique outperforms the conventional technique.
  • プロトタイピングによるモノづくりの可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2010 (71) 2010 [Not refereed][Not invited]
  • Naofumi Aoki
    Proceedings - 2010 6th International Conference on Intelligent Information Hiding and Multimedia Signal Processing, IIHMSP 2010 534 - 537 2010 [Refereed][Invited]
     
    Steganography may be employed for secretly transmitting side information in order to improve the performance of signal processing such as packet loss concealment and band extension of telephony speech. The previous studies employ LSB replacement technique for embedding steganogram information into speech data. Instead of such a lossy steganography technique, this study has investigated a lossless steganography technique for G.711, the most common codec for telephony systems such as VoIP. The proposed technique in this study exploits the redundancy of G.711 for embedding steganogram information into speech data without degradation. This paper newly investigates the possibility of a semi-lossless steganography technique for increasing the capacity of the lossless steganography technique. © 2010 IEEE.
  • DVI-ADPCMに対するロスレスステガノグラフィの一手法
    青木 直史
    電子情報通信学会論文誌A J93-A (2) 104 - 106 2010 [Refereed][Not invited]
  • リアルバーチャリティー - 映像の中のウソ -
    栗田 正樹, 青木 直史
    映像情報メディア学会技術報告 33 (47) 2009 [Not refereed][Not invited]
  • IP電話におけるロスレス方式のステガノグラフィ技術
    青木 直史
    電子情報通信学会技術研究報告通信方式研究会資料 CS2009 (53) 2009 [Not refereed][Not invited]
  • テキストによる音の表現に関する一考察
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2009 (49) 2009 [Not refereed][Not invited]
  • 狭帯域電話音声の帯域拡張に関する一考察
    青木 直史
    電子情報通信学会技術研究報告コミュニケーションクオリティ研究会資料 CQ2009 (21) 2009 [Not refereed][Not invited]
  • サウンドエフェクトを題材としたプログラミング演習
    青木 直史
    電子情報通信学会技術研究報告音声研究会資料 SP2009 (29) 2009 [Not refereed][Not invited]
  • A lossless steganography technique for G.711 telephony speech
    AOKI Naofumi
    APSIPA Annual Summit and Conference 274 - 277 2009 [Refereed][Not invited]
  • Naofumi Aoki
    IIH-MSP 2009 - 2009 5th International Conference on Intelligent Information Hiding and Multimedia Signal Processing 487 - 490 2009 [Refereed][Invited]
     
    This study investigates a band extension technique for the narrow-band telephony speech encoded with G.711, the most common codec employed in digital speech communications such as IP telephony services. The proposed technique employs full wave rectification that nonlinearly generates high-band overtones. In order to improve the conventional technique, this study investigates the possibility of a subband gain control based on the transmission of side information by using steganography. From the subjective evaluation, it is indicated that the proposed technique may potentially outperform the conventional technique. © 2009 IEEE.
  • Naofumi Aoki
    NCM 2009 - 5th International Joint Conference on INC, IMS, and IDC 1689 - 1692 2009 [Refereed][Not invited]
     
    Steganography can be employed for transmitting side information improving the performance of signal processing such as packet loss concealment and band extension of telephony speech. The previous studies employ LSB replacement technique for embedding steganogram information into speech data. Instead of such a lossy steganography technique, this study investigates the possibility of lossless steganography techniques for G.711 and DVI-ADPCM, the codecs employed in IP telephony services. The proposed techniques in this study exploit the redundancy of the folded binary code employed in these codecs for embedding steganogram information into speech data without degradation. © 2009 IEEE.
  • 音のリアルバーチャリティに関する一考察
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2008 (46) 2008 [Not refereed][Not invited]
  • MATLABによるサウンド処理のプログラミング演習
    青木 直史
    電子情報通信学会技術研究報告音声研究会資料 SP2008 (33) 2008 [Not refereed][Not invited]
  • H8マイコンによる学習用IP電話スタータキットの開発
    青木 直史
    電子情報通信学会技術研究報告情報ネットワーク研究会資料 IN2008 (19) 2008 [Not refereed][Not invited]
  • 全波整流にもとづく狭帯域電話音声の一帯域拡張法
    青木 直史
    電子情報通信学会技術研究報告音声研究会資料 SP2007 (214) 2008 [Not refereed][Not invited]
  • 非線形量子化にもとづく音声コーデックにおけるロスレスステガノグラフィの一手法
    青木 直史
    電子情報通信学会技術研究報告非線形問題研究会資料 NLP2007 (141) 2008 [Not refereed][Not invited]
  • AOKI Naofumi
    International Conference on Digital Audio Effects 161 - 164 2008 [Refereed][Not invited]
  • Naofumi Aoki
    2008 FOURTH INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING, PROCEEDINGS 608 - 611 2008 [Refereed][Invited]
     
    This study proposes a technique of lossless steganography for G.711, the most common codec for digital speech communications such as VoIP (Voice over IP). The proposed technique in this study exploits the characteristics of G.711 for embedding steganogram information without any degradation. This paper shows the capacity of the proposed technique.
  • 青木 直史
    コンピュータ&エデュケーション 24 26 - 31 2008 [Refereed][Invited]
  • Naofumi Aoki
    IEICE TRANSACTIONS ON COMMUNICATIONS E90B (11) 3271 - 3273 0916-8516 2007/11 [Refereed][Not invited]
     
    This study proposes a technique of lossless steganography for G.711, the most common codec for digital speech communications systems such as VoIP. The proposed technique exploits the characteristics of G.711 for embedding steganogram information without degradation. This paper shows the capacity of the proposed technique.
  • モノづくりにおけるWeb2.0の可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2007 (45) 2007 [Not refereed][Not invited]
  • G.711におけるロスレスステガノグラフィに関する一考察
    青木 直史
    電子情報通信学会技術研究報告回路とシステム研究会資料 CAS2007 (33) 2007 [Not refereed][Not invited]
  • Naofumi Aoki
    2007 THIRD INTERNATIONAL CONFERENCE ON INTELLIGENT INFORMATION HIDING AND MULTIMEDIA SIGNAL PROCESSING, VOL II, PROCEEDINGS 2 251 - 254 2007 [Refereed][Invited]
     
    This study investigates the potential of value-added speech communications by using steganography. The quality of speech communications based on VoIP may potentially be degraded by packet loss that is basically inevitable in best-effort communications. This study proposes a packet loss concealment technique for mitigating such degradation by using steganography. In addition, this study also proposes a band extension technique by using steganography.
  • 全波整流に基づくステガノグラフィを用いたG.711音声の一帯域拡張法
    青木 直史
    電子情報通信学会論文誌B J90-B (7) 697 - 704 2007 [Refereed][Not invited]
  • Naofumi Aoki
    IEICE TRANSACTIONS ON COMMUNICATIONS E89B (6) 1896 - 1898 0916-8516 2006/06 [Refereed][Not invited]
     
    This study investigates a band extension technique for speech data encoded with G.711, the most common codec for digital speech communications system such as VoIP. The proposed technique employs steganography for the transmission of the side information required for the band extension. Due to the steganography, the proposed technique is able to enhance the speech quality without an increase of the amount of data transmission. From the results of a subjective experiment, it is indicated that the proposed technique may potentially be useful for improving the speech quality, compared with the conventional technique.
  • ステガノグラフィによる電話音声の帯域拡張
    青木 直史
    電子情報通信学会技術研究報告音声研究会資料 SP2006 (81) 2006 [Refereed][Not invited]
  • 無線通信を利用した参加型エンターテインメントの可能性に関する一検討
    青木 直史
    電子情報通信学会技術研究報告通信方式研究会資料 CS2006 (39) 2006 [Not refereed][Not invited]
  • アミューズメント分野におけるIT系モノづくりの可能性
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2006 (49) 2006 [Not refereed][Not invited]
  • リアルバーチャリティの要因に関する一考察
    青木 直史, 栗田 正樹
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2005 (81) 2006 [Not refereed][Not invited]
  • カラーユニバーサルデザイン - 色覚異常者の見え方と今後の課題,そしてカラーユニバーサルデザインへ -
    栗田 正樹, 青木 直史
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2005 (69) 2006 [Not refereed][Not invited]
  • リアルバーチャリティを考慮したモノづくりの可能性
    青木 直史
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2005 (68) 2006 [Not refereed][Not invited]
  • A band extension technique for G.711 speech based on full wave rectification and steganography
    AOKI Naofumi
    AES 29th International Conference 124 - 127 2006 [Refereed][Not invited]
  • Mori Kaori, Aoki Naofumi, Kosugi Naomi, Soga Toshioki, Tanahashi Jiro, Fujisawa Noriyoshi
    Computer & Education CIEC 21 17 - 23 2186-2168 2006 [Refereed][Not invited]
     
    A survey and skill test were conducted in 11 universities in Hokkaido in a population of approximately 2000 students in 2006, when many of the students had taken the general course subject"Information Study", which was newly set as a mandatory course in high schools, had entered university. The results indicated that the students had covered a wide range of subjects through the Information Study course, and many of the items using computers overlap with the educational content of the courses offered in universities. However, many of the students answered that they could not perform the task for many of the items in the test, and that they are looking for fundamental content that uses the computer operation in information education at university. These results of this survey will form a basis for information education in Hokkaido. In future, this will contribute to liaison between those responsible for information education in high schools and universities.
  • N Aoki
    ELECTRONICS AND COMMUNICATIONS IN JAPAN PART I-COMMUNICATIONS 89 (3) 1 - 9 8756-6621 2006 [Refereed][Invited]
     
    In order-to-realize speech communication by means of best-effort packet communications, which is inherently unsuitable for real-time processing, VoIP addresses the fundamental problem of degradation of communications quality by errors such as packet loss and delay. In the present research, based on the two-sided PWR method, an error concealment technique based on waveform replication, a method of performing error concealment more effectively by taking account of the pitch variations of the speech data in the loss frame is proposed. Evaluation experiments with SNR, PESQ, and DMOS as the metrics suggest the effectiveness of the proposed method. (c) 2005 Wiley Periodicals, Inc.
  • 不特定話者認識及び音声合成の性能向上を勘案した音素セグメンテーション
    岡田 一秀, 青木 直史, 赤澤 堅造
    日本音響学会聴覚研究会資料 H-2005 (104) 2005 [Not refereed][Not invited]
  • Naofumi Aoki, Hironari Arai, Kouhei Takano, Tomohiro Namerikawa, Isao Ohmura
    Canadian Conference on Electrical and Computer Engineering 2005 308 - 311 0840-7789 2005 [Refereed][Not invited]
     
    Speech quality of VoIP (Voice over Internet Protocol) may potentially be degraded by transmission errors such as packet loss and delay which are basically inevitable in best-effort communications. This study proposes an error concealment technique for such degradation by exploiting a receiver-based technique called pitch waveform replication. For improving the conventional technique, this study investigates a waveform reconstruction technique that also takes account of the pitch variation between the backward and forward frames of gap frames. From experimental results of objective and subjective evaluation, it is indicated that the proposed technique may potentially be useful for improving the speech quality, compared with the conventional technique. In addition, this study has also developed a hardware VoIP system that implements the proposed error concealment technique. © 2005 IEEE.
  • YOSAKOIソーラン祭りのためのサイバー鳴子の開発
    青木 直史, 棚橋 真, 岸本 英一, 桑野 晃希, 安田 星季, 岩越 睦郎
    電子情報通信学会技術研究報告ヒューマン情報処理研究会資料 HIP2004 (111) 2005 [Not refereed][Not invited]
  • リアルバーチャリティの可能性について
    青木 直史
    電子情報通信学会技術研究報告マルチメディア・仮想環境基礎研究会資料 MVE2005 (43) 2005 [Not refereed][Not invited]
  • 波形の形状分析に基づく音素セグメンテーションの一検討
    岡田 一秀, 青木 直史
    日本音響学会聴覚研究会資料 H-2005 (26) 2005 [Not refereed][Not invited]
  • 波形複製におけるピッチ変動を考慮したVoIPにおけるパケット損の一隠ぺい法
    青木 直史
    電子情報通信学会論文誌B J88-B (5) 913 - 920 2005 [Refereed][Not invited]
  • サイバー鳴子が彩るYOSAKOIソーラン祭りの夜
    青木 直史
    照明学会誌 89 (3) 166 - 168 2005 [Refereed][Invited]
  • N Aoki
    IEICE TRANSACTIONS ON COMMUNICATIONS E87B (4) 1041 - 1044 0916-8516 2004/04 [Refereed][Not invited]
     
    Speech quality of VoIP (Voice over Internet Protocol) may potentially be degraded by transmission errors such as packet loss and delay which are basically inevitable in best-effort communications. This study investigates an error concealment technique for such degradation by using a receiver-based technique called pitch waveform replication. For enhancing the conventional technique, this study proposes a waveform reconstruction technique that also takes account of the pitch variation between the backward and forward frames of gap frames. From experimental results of objective evaluation, it is indicated that the proposed technique may potentially be useful for improving the speech quality, compared with the conventional technique.
  • フォトリフレクタ方式によるギター演奏動作のキャプチャリング
    青木 直史, 棚橋 真, 岸本 英一, 安田 星季, 岩越 睦郎
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2003 (53) 2004 [Not refereed][Not invited]
  • Capturing guitar fingering by photo-reflector technique
    AOKI Naofumi, TANAHASHI Shin, KISHIMOTO Eiichi, YASUDA Seiki, IWAKOSHI Mutsuroh
    Baltic-Nordic Acoustics Meeting 1-4 1 - 4 2004 [Refereed][Not invited]
  • N Aoki
    TENCON 2004 - 2004 IEEE REGION 10 CONFERENCE, VOLS A-D, PROCEEDINGS C52 - C55 0886-1420 2004 [Refereed][Not invited]
     
    Speech quality of VoIP (Voice over Internet Protocol) may potentially be degraded by transmission errors such as packet loss and delay which are basically inevitable in best-effort communications. This study investigates an error concealment technique for such degradation by using a receiver-based technique called pitch waveform replication. For enhancing the conventional technique, this study proposes a waveform reconstruction technique that also takes account of the pitch variation between the backward and forward frames of gap frames. From experimental results of objective evaluation, it is indicated that the proposed technique may potentially be useful for improving the speech quality, compared with the conventional technique.
  • 波形複製におけるピッチ変動を考慮したVoIPにおけるパケット損失の一隠蔽法
    青木 直史
    電子情報通信学会技術研究報告コミュニケーションクオリティ研究会資料 CQ2003 (125) 2004 [Not refereed][Not invited]
  • 青木 直史
    コンピュータ&エデュケーション 16 10 - 15 2004 [Refereed][Invited]
  • Modification of two-side pitch waveform replication technique for VoIP packet loss concealment
    AOKI Naofumi
    IEICE Transactions on Communications E87-B (4) 1041 - 1044 2004 [Refereed][Not invited]
  • N Komaki, N Aoki, T Yamamoto
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES E86A (8) 2069 - 2072 0916-8508 2003/08 [Refereed][Not invited]
     
    Speech quality of VoIP (Voice over Internet Protocol) may potentially be degraded by transmission errors such as packet loss and delay that are basically inevitable in best-effort communications. This study newly proposes an error concealment technique for such degradation by taking account of both sender-based and receiver-based techniques. In the proposed technique, sender-based side information, which is required by the receiver-based technique, is transmitted by using steganography, so that its datagram is completely compatible with the conventional format of VoIP. From experimental results of objective evaluation, it is indicated that the proposed technique may potentially be useful for improvement of speech quality, compared with the conventional technique.
  • MATSUMOTO Kousuke, AOKI Naofumi, AOKI Yoshinao
    ITE Technical Report 一般社団法人 映像情報メディア学会 27 123 - 128 2003 
    In this paper, we propose a new watermark technique, where we embed two kinds of watermark data into DCT coefficients of JPEG images. The first watermark data is a series of compressed binary data related to great and small relations of the coefficients of JPEG image. The second watermark data is a side information. Those two kinds of watermark data are embedded into the low frequency region of DCT. We confirm the validity of proposed method, where we can restore the original clear image by using user's Key from the embedded unclear image. Moreover, we consider the application to MPEG.
  • KURITA Masaki, YAMADA Yousuki, AOKI Naofumi, AOKI Yoshinao
    ITE Technical Report 一般社団法人 映像情報メディア学会 27 193 - 196 2003 
    Today the internet uses a lot of text, pictures, videos, animations, etc. to communicate eachother. In this article, we expose the Communicating System using Avator that is easy to make, easy to move, and easy to communicate for everyone. We made two types of 3D models based on MPEG-4 facial animation parameters. One is real face model, the other is a ANIME-model. We will make a database of human emotions that will contribute to easy making facial 3D animation.
  • HOU Rong, AOKI Naofumi, AOKI Yoshinao
    ITE Technical Report 一般社団法人 映像情報メディア学会 27 119 - 122 2003 
    In recent years, biometrics has been arising as a technique for user identification. Biometrics employs user's biological characteristics, such as fingerprint, face, and DNA, as ID. In order to apply this technology safely, it is necessary to guarantee the certainty of biometrics data. Digital-watermarking technology has been proposed for this purpose. This technology is used basically for embedding copyright information imperceptibly into digital contents, in order to protect the contents from malicious use. In this study, a robust digital watermarking technique is proposed for the protection of fingerprint image.
  • ステガノグラフィによる高付加価値通信の可能性
    青木 直史
    電子情報通信学会技術研究報告通信方式研究会資料 CS2003 (116) 2003 [Not refereed][Not invited]
  • ロバスト型電子透かしの指紋画像への応用
    侯 蓉, 青木 直史, 青木 由直
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2002 (102) 2003 [Not refereed][Not invited]
  • ステガノグラフィを用いたVoIPにおけるパケット損失の一隠蔽法
    青木 直史
    電子情報通信学会技術研究報告通信方式研究会資料 CS2003 (47) 2003 [Not refereed][Not invited]
  • ステガノグラフィを用いたVoIPにおける音声の広帯域化に関する一検討
    青木 直史
    電子情報通信学会技術研究報告音声研究会資料 SP2003 (72) 2003 [Not refereed][Not invited]
  • ロスレス型電子透かしを用いたユーザー認証と動画への応用
    松本 康佑, 青木 直史, 青木 由直
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2002 (103) 2003 [Not refereed][Not invited]
  • 高次局所自己相関特徴と判別分析による顔画像の表情認識
    山田 陽介, 青木 直史, 山本 強
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2002 (67) 2003 [Not refereed][Not invited]
  • ユビコン環境利用化身話システム構築のための調査研究
    栗田 正樹, 山田 陽介, 青木 直史, 青木 由直
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2002 (116) 2003 [Not refereed][Not invited]
  • 数論変換の脆弱型電子透かしとロスレス電子透かしへの応用
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会技術研究報告高度交通システム研究会資料 ITS2002 (101) 2003 [Not refereed][Not invited]
  • MOGAによるギタータブ譜自動作成に関する一考察
    青木 直史
    電子情報通信学会技術研究報告非線形問題研究会資料 NLP2002 (99) 2003 [Not refereed][Not invited]
  • ピッチ波形複製法に基づくステガノグラフィを用いたVoIPにおけるパケット損失の一隠蔽法
    青木 直史
    電子情報通信学会論文誌B J86-B (12) 2551 - 2560 2003 [Refereed][Not invited]
  • 数論変換による脆弱型電子透かしを用いた改ざん位置検出法
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会論文誌A J86-A (8) 872 - 879 2003 [Refereed][Not invited]
  • H Tamori, N Aoki, T Yamamoto
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES E85A (8) 1902 - 1904 0916-8508 2002/08 [Refereed][Not invited]
     
    This paper suggests that a watermarking technique based on the number theoretic transform (NTT) may effectively be employed for detecting alterations on lossless digital master images. Due to its fragility, the NTT-based technique is sensitive to detecting alterations, compared with that based on the discrete Fourier transform (DFT).
  • MPEG-4の仕様に準拠した顔パラメータの抽出に関する一考察
    山田 陽介, 青木 直史, 山本 強
    電子情報通信学会技術研究報告画像工学研究会資料 IE2002 (32) 2002 [Not refereed][Not invited]
  • ギタータブ譜作成における遺伝的アルゴリズムの適用
    青木 直史
    電子情報通信学会技術研究報告非線形問題研究会資料 NLP2002 (26) 2002 [Not refereed][Not invited]
  • 波形置換に基づくVoIPにおけるパケット損失の一隠蔽法
    小牧 憲子, 青木 直史, 山本 強
    電子情報通信学会技術研究報告コミュニケーションクオリティ研究会資料 CQ2002 (59) 2002 [Not refereed][Not invited]
  • 数論変換による脆弱型電子透かしを用いた静止画像の改ざん位置検出と改ざん訂正
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会技術研究報告画像工学研究会資料 IE2002 (45) 2002 [Not refereed][Not invited]
  • Lecture on digital signal processing using wireless LAN
    HOMMA Hirotoshi, AOKI Yoshinao, AOKI Naofumi, YAMAMOTO Tsuyoshi
    IEEE International Conference on Information Technology Based Higher Education and Training 2002 [Refereed][Not invited]
  • N Aoki
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES E84A (9) 2198 - 2206 0916-8508 2001/09 [Refereed][Not invited]
     
    A high quality speech synthesis technique based on the wavelet subband analysis of speech signals was newly devised for enhancing the naturalness of synthesized voiced consonant speech. The technique reproduces a speech characteristic of voiced consonant speech that shows unvoiced feature remarkably in the high frequency subbands. For mixing appropriately the unvoiced feature into voiced speech, a noise inclusion procedure that employed the discrete wavelet transform was proposed. This paper also describes a developed speech synthesizer that employs several random fractal techniques. These techniques were employed for enhancing especially the naturalness of synthesized purely voiced speech. Three types of fluctuations, (1) pitch period fluctuation, (2) amplitude fluctuation, and (3) waveform fluctuation were treated in the speech synthesizer. In addition, instead of a normal impulse train, a triangular pulse was used as a simple model for the glottal excitation pulse. For the compensation for the degraded frequency characteristic of the triangular pulse that overdecreases than the spectral -6dB/oct characteristic required for the glottal excitation pulse, the random fractal interpolation technique was applied. In order to evaluate the developed speech synthesis system, psychoacoustic experiments were carried out. The experiments especially focused on how the mixed excitation scheme effectively contributed to enhancing the naturalness of voiced consonant speech. In spite that the proposed techniques were just a little modification for enhancing the conventional LPC (linear predictive coding) speech synthesizer, the subjective evaluation suggested that the system could effectively gain the naturalness of the synthesized speech that tended to degrade in the conventional LPC speech synthesis scheme.
  • ステガノグラフィを用いたVoIPにおけるパケット消失隠蔽に関する一考察
    青木 直史, 山本 強, 青木 由直
    電子情報通信学会技術研究報告情報ネットワーク研究会資料 IN2001 (107) 2001 [Not refereed][Not invited]
  • XMLによる音声データベースの構築とクライアント/サーバー音声合成システムの開発
    青木 直史, アレキサンダー・ブルガー, 山本 強, 青木 由直
    電子情報通信学会技術研究報告データ工学研究会資料 DE2001 (112) 2001 [Not refereed][Not invited]
  • 非線形マッチング処理を用いた音声波形ゆらぎ解析と音声合成への応用
    青木 直史
    電子情報通信学会技術研究報告非線形問題研究会資料 NLP2001 (30) 2001 [Not refereed][Not invited]
  • MPEG4に準拠した顔アニメーション生成に関する一考察
    山田 陽介, 青木 直史, 山本 強
    電子情報通信学会技術研究報告画像工学研究会資料 IE2001 (41) 2001 [Not refereed][Not invited]
  • 数論変換を用いた改ざん検出可能な電子透かし方式
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会技術研究報告画像工学研究会資料 IE2001 (33) 2001 [Not refereed][Not invited]
  • Analysis and synthesis of waveform fluctuation in sustained vowels based on a nonlinear time warping technique
    AOKI Naofumi
    IEICE International Symposium on Nonlinear Theory and its Applications 445 - 448 2001 [Refereed][Not invited]
  • The synthesis of MPEG-4 based facial animation by tracking feature points of facial images
    YAMADA Yosuke, AOKI Naofumi, YAMAMOTO Tsuyoshi
    International Symposium: Toward a Development of KANSEI Technology 219 - 222 2001 [Refereed][Not invited]
  • Development of a speech synthesis system utilizing a Lisp XML interface
    AOKI Naofumi, BURGER Alexander
    International Symposium: Toward a Development of KANSEI Technology 165 - 168 2001 [Refereed][Not invited]
  • Frequency domain analysis and synthesis of the waveform fluctuations in sustained vowels
    AOKI Naofumi
    International Symposium: Toward a Development of KANSEI Technology 113 - 116 2001 [Refereed][Not invited]
  • N Aoki, T Ifukube
    ELECTRONICS AND COMMUNICATIONS IN JAPAN PART III-FUNDAMENTAL ELECTRONIC SCIENCE 84 (1) 11 - 20 1042-0967 2001 [Refereed][Invited]
     
    Random fractal character observed in vowel source signals obtained by linear predictive analysis was investigated using a multiresolution analysis method based on Schauder expansion. With the results of the Schauder analysis, a technique for enhancing the naturalness of synthesized vowels was newly developed. Synthesized vowels produced by a linear predictive synthesis method tend to exhibit a butterlike unnatural quality due to oversimplifying the source signals as an impulse train. This study shows that such degraded voice quality can be improved by (1) removing the discontinuities in the impulse train, and (2) restoring the reduced power in the high-frequency region by employing random fractal interpolation technique devised in this study. Psychoacoustic experiments evaluated the validity of the proposed technique. (C) 2000 Scripta Technica.
  • 多重解像度解析に基づく音声信号のピッチ抽出に関する一考察
    青木 直史
    電子情報通信学会技術研究報告ディジタル信号処理研究会資料 DSP2000 (65) 2000 [Not refereed][Not invited]
  • ギター演奏の学習支援を目的としたタブ譜作成自動化に関する検討
    青木 直史, 青木 由直, 山本 強
    電子情報通信学会技術研究報告教育工学研究会資料 ET2000 (43) 2000 [Not refereed][Not invited]
  • 音声信号におけるランダムネスの解析に基づいた高品質音声合成の実現
    青木 直史
    電子情報通信学会技術研究報告回路とシステム研究会資料 CAS2000 (42) 2000 [Not refereed][Not invited]
  • Embedding and extracting digital watermark using the average of DCT coefficients
    MORITA Yuji, AOKI Yoshinao, AOKI Naofumi, YAMAMOTO Tsuyoshi
    IEEE International Symposium on Intelligent Signal Processing and Communication Systems 375 - 378 2000 [Refereed][Not invited]
  • Development of a rule-based speech synthesis system for the Japanese language using a MELP vocoder
    AOKI Naofumi
    European Signal Processing Conference 773 - 776 2000 [Refereed][Not invited]
  • N Aoki, Y Aoki, Y Kudoh, N Tonouchi, M Takase
    ACOUSTICAL IMAGING, VOL 25 25 229 - 234 0270-5117 2000 [Refereed][Not invited]
  • Construction of an avatar language chatting system for communication across the linguistic barrier of different languages
    AOKI Yoshinao, KIM Jun-Soek, AOKI Naofumi, YAMAMOTO Tsuyoshi, BURGER Alexander, KIM Sang-Woon
    IASTED International Conference on Signal Processing and Communications 490 - 494 2000 [Refereed][Not invited]
  • Low bit-rate video by creation of avatars for a certain class of video images - a VRML/Java approach
    TAKAYA Kunio, AOKI Naofumi
    IEEE International Conference on Communications, Control and Signal Processing 239 - 243 2000 [Refereed][Not invited]
  • N Aoki, T Ifukube
    JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA 106 (1) 423 - 433 0001-4966 1999/07 [Refereed][Not invited]
     
    Two kinds of fluctuations are always observed in the steady parts of normal sustained vowels. One is amplitude fluctuation, defined as the cyclic changes of maximum peak amplitudes. The other is period fluctuation, defined as the cyclic changes of pitch periods. The primary purpose of this paper is to present quantitative descriptions of amplitude and period sequences obtained from normal sustained vowels. These fluctuation sequences consisted of maximum peak amplitudes or pitch periods extracted successively from 512 consecutive pitch periods in the steady part. Results of the frequency analysis indicated that their frequency characteristics seemed to be subject to the spectral 1/f power law. In order to investigate the possibility that the frequency characteristics of the fluctuation sequences influence the voice quality of sustained vowels, psychoacoustic experiments were conducted. Amplitude and period sequences evaluated in the experiments were spectral 1/f(0) (white noise), 1/f, 1/f(2), and 1/f(3) sequences, respectively. The experimental results indicated that the subjective voice quality of synthesized sustained vowels could reflect the differences in the frequency characteristics of the fluctuation sequences. (C) 1999 Acoustical Society of America. [S0001-4966(99)01507-6].
  • N. Aoki, T. Ifukube, K. Takaya
    IEEE Region 10 Annual International Conference, Proceedings/TENCON 1 194 - 197 2159-3450 1999 [Refereed][Not invited]
     
    This paper describes an implementation of MELP (mixed excitation linear prediction) vocoder. Subband division required for implementing the MELP vocoder was performed by the lifting wavelet transform. A new method to generate an appropriate glottal waveform was devised. In addition, three kinds of fluctuations observed in the steady parts of voiced speech were incorporated to enhance the naturalness of synthesized speech.
  • Wavelet subband filters for mixed excitation linear predictive (MELP) vocoder
    AOKI Naofumi, TAKAYA Kunio
    IEEE International Symposium on Intelligent Signal Processing and Communication Systems 753 - 756 1999 [Refereed][Not invited]
  • MELP vocoder using lifting wavelet transform
    AOKI Naofumi, TAKAYA Kunio
    IEEE Pacific Rim Conference on Communications, Computers and Signal Processing 392 - 395 1999 [Refereed][Not invited]
  • Modeling the randomness of speech signals for the enhancement of the voice quality of synthesized speech
    AOKI Naofumi, IFUKUBE Tohru, TAKAYA Kunio
    15th International Conference on Noise in Physical Systems and 1/f Fluctuations 199 - 202 1999 [Refereed][Not invited]
  • H.263 facial video image coding with the MELP voice codec
    TAKAYA Kunio, DING Li, AOKI Naofumi
    IEEE International Workshop on Soft Computing in Industry 228 - 233 1999 [Refereed][Not invited]
  • 青木 直史, 伊福部 達
    電子情報通信学会論文誌A 一般社団法人電子情報通信学会 J82-A (9) 1437 - 1445 0913-5707 1999 [Refereed][Not invited]
  • 合成持続発声母音の自然性改善を目的とした音源波形揺らぎの生成とその主観的および客観的評価
    青木 直史, 伊福部 達
    電子情報通信学会論文誌D-II J82-D-II (5) 843 - 852 1999 [Refereed][Not invited]
  • 持続発声母音における振幅ゆらぎ及びピッチゆらぎの周波数特性とその音響心理的効果
    青木 直史, 伊福部 達
    電子情報通信学会論文誌A J82-A (5) 649 - 657 1999 [Refereed][Not invited]
  • N Aoki, T Ifukube
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES E81A (9) 1803 - 1810 1745-1337 1998/09 [Refereed][Not invited]
     
    The naturalness of normal sustained vowels is considered to be attributable to the fluctuations observed in the steady part where speech signal is seemingly almost periodic. There always exist two kinds of involuntary fluctuations in the steady part of sustained vowels, even if the sustained vowels are phonated as steadily as possible. One is pitch period fluctuation and the other is waveform fluctuation. In this study, frequency analyses on these fluctuations were conducted in order to investigate their general characteristics. The results of the analyses suggested that the frequency characteristics of the fluctuations were possible to be approximated as 1/f(beta)-like, which is regarded as the specific feature of random fractal. Therefore, a procedure based on random fractal generation methods was proposed in order to produce these fluctuations for the improvement of the voice quality of synthesized sustained vowels. A series of psychoacoustic experiments was also conducted to evaluate the proposed technique. Experimental results indicated that the proposed technique was effective for synthesized sustained vowels to be perceived as human-like. Unlike the sustained vowels which were synthesized without pitch period fluctuation nor waveform fluctuation, the synthesized sustained vowels which contained the fluctuations were not perceived as buzzer-like, which is the major problem of the voice quality of synthesized sustained vowels. However, it was also found that both of the fluctuations were not always the acoustic cues for the naturalness of normal sustained vowels. The synthesized sustained vowels which contained the fluctuations whose frequency characteristics were the same as that of white noise were perceived as noise-like, which is not at all the voice quality of normal sustained vowels. The results of psychoacoustic experiments indicated that the frequency characteristics of the fluctuations, which are possible to be modeled as 1/f(beta)-like, were the significant factors for the naturalness of normal sustained vowels.
  • PARCOR分析合成システムにおける母音音源波形のウェーブレット圧縮に関する考察
    青木 直史, 伊福部 達
    電子情報通信学会技術研究報告音声研究会資料 SP97 (126) 1998 [Not refereed][Not invited]
  • PARCOR分析合成における音源信号のウェーブレット解析とそれに基づいたパルス列音源の改善
    青木 直史, 伊福部 達
    日本音響学会聴覚研究会資料 H-98 (49) 1998 [Not refereed][Not invited]
  • Y Kudoh, Y Aoki, N Aoki
    ICSP '98: 1998 FOURTH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING, PROCEEDINGS, VOLS I AND II 1399 - 1402 1998 [Refereed][Not invited]
     
    It is assumed that some ancient structures were designed to have acoustic effects such as amplification of a speaker's voice. Since sounds leave no marks, this assumption can only be confirmed by measuring the acoustical reflection characteristics of the structure. In order to theoretically understand the characteristics of echoic phenomena, we developed the acoustical ray tracing method based on the principle that spatial frequencies of acoustical signals correspond to the slope of acoustical rays. This paper shows that the inverse propagation of rays reflected from a plane wall can be visualized according to the above principle, resulting in the display of a few secondary sound sources on a rock wall. Examples of computer simulation and a preliminary experiment are presented along with a theoretical formulation.
  • N Aoki, T Ifukube
    ICSP '98: 1998 FOURTH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING, PROCEEDINGS, VOLS I AND II 650 - 653 1998 [Refereed][Not invited]
     
    It is considered that the buzz voice quality of thesized speech. which is one of the major problems of PARCOR synthesizer, is caused by rapid and large discontinuities: of pulse train source signals. This paper focuses on the characteristics of the discontinuities in source signals which are derived from sustained voir cis using PACOR inverse filtering. Wavelet analysis indicates that the characteristics of the discontinuities in these source signals are different from those of pulse train. Based on this result, a new technique for the modification of pulse train is proposed.
  • Fractal modeling of glottal waveform for high quality speech synthesis
    AOKI Naofumi, IFUKUBE Tohru
    16th International Congress on Acoustics and 135th Meeting Acoustical Society of America 245 - 246 1998 [Refereed][Not invited]
  • 1/fピッチゆらぎおよび1/f振幅ゆらぎの母音合成における有効性の検討
    青木 直史, 伊福部 達
    電子情報通信学会技術研究報告音声研究会資料 SP96 (125) 1997 [Not refereed][Not invited]
  • 母音における波形ゆらぎの生成とその知覚特性
    青木 直史, 伊福部 達
    日本音響学会聴覚研究会資料 H-97 (43) 1997 [Not refereed][Not invited]
  • 合成持続発声母音の自然性改善を目的とした波形ゆらぎの生成とその主観的および客観的評価
    青木 直史, 伊福部 達
    電子情報通信学会技術研究報告音声研究会資料 SP97 (52) 1997 [Not refereed][Not invited]
  • AOKI Naofumi, IFUKUBE Tohru
    IEICE International Symposium on Nonlinear Theory and its Applications 1185 - 1188 1997 [Refereed][Invited]
  • N Aoki, T Ifukube
    ICICS - PROCEEDINGS OF 1997 INTERNATIONAL CONFERENCE ON INFORMATION, COMMUNICATIONS AND SIGNAL PROCESSING, VOLS 1-3 998 - 1002 1997 [Refereed][Not invited]
     
    It is indicated that the pitch-synchronous subtle waveform fluctuations of sustained vowels are the acoustic cue for the naturalness in case the sustained vowels do not include fundamental frequency fluctuations. From the viewpoint of speech synthesis, it is expected that the more naturally sounding sustained vowels can be synthesized by incorporating the appropriately modeled waveform fluctuations. In this study, the waveform fluctuations of the inverse-filtered normal sustained vowels were analyzed with the aim of high quality speech synthesis. The series of the analyses suggested that the waveform fluctuations could be modeled by the same rule for all speech samples obtained from ten male subjects. In addition, the psychoacoustic experiments confirmed the validity of the method which generates the completely artificial waveform fluctuations for the remarkable enhancement of the quality of sustained vowels.
  • 音源信号の振幅ゆらぎによる合成音の自然性
    青木 直史, 伊福部 達
    電子情報通信学会技術研究報告音声研究会資料 SP95 (137) 1996 [Not refereed][Not invited]
  • 1/fピッチゆらぎによる合成母音の自然性の向上
    青木 直史, 伊福部 達
    日本音響学会聴覚研究会資料 H-96 (42) 1996 [Not refereed][Not invited]
  • N Aoki, T Ifukube
    ICECS 96 - PROCEEDINGS OF THE THIRD IEEE INTERNATIONAL CONFERENCE ON ELECTRONICS, CIRCUITS, AND SYSTEMS, VOLS 1 AND 2 311 - 314 1996 [Refereed][Not invited]
     
    Two fluctuations are always observed in sustained phonation. These have been called shimmer (perturbations of glottal pulse amplitudes) and jitter (perturbations of pitch period durations). Both are known as involuntary laryngeal behaviors during the phonation. Our study on these phenomena revealed that their characteristics from nonpathological phonation are not completely random but are regulated by the power law, that is widely known as 1/f(gamma) fluctuation. In order to indentify the roles of 1/f(gamma) jitter and shimmer, a series of psychoacoustic experiments was conducted. In a paired comparisons test each of twenty-five subjects individually was instructed to select more human-like synthetic voices among stimuli with four different jitter patterns such as Gaussian white noise, 1/f(gamma) fluctuation, summation of three sinusoids fluctuation, and no fluctuation. Another comparisons test about stimuli with three different shimmer patterns also was conducted. The results of the experiments supported that both 1/f(gamma) jitter and shimmer are crucial cues for a synthetic voice to be perceived as natural.
  • An analysis of fluctuation on sustained vowel waveform from the viewpoint of 1/f shimmers
    AOKI Naofumi, IFUKUBE Tohru
    Joint Meeting of the Acoustical Society of America and the Acoustical Society of Japan 913 - 918 1996 [Refereed][Not invited]

MISC

  • 青木 直史, 藍 圭介  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  117-  (252)  55  -58  2017/10/19
  • 青木 直史, 藍 圭介  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  116-  (449)  1  -6  2017/01/30
  • Aoki Naofumi  THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN  73-  (4)  230  -238  2017  [Refereed][Invited]
  • 青木 直史, 藍 圭介  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  116-  (34)  99  -102  2016/05/19
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第2回)
    青木 直史, 藍 圭介  Interface  (1)  170  -173  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第3回)
    青木 直史, 藍 圭介  Interface  (2)  160  -163  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第4回)
    青木 直史, 藍 圭介  Interface  (3)  156  -158  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第5回)
    青木 直史, 藍 圭介  Interface  (4)  146  -148  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第6回)
    青木 直史, 藍 圭介  Interface  (5)  142  -144  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第7回)
    青木 直史, 藍 圭介  Interface  (6)  147  -151  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第8回)
    青木 直史, 藍 圭介  Interface  (7)  150  -152  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第9回)
    青木 直史, 藍 圭介  Interface  (8)  126  -130  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第10回)
    青木 直史, 藍 圭介  Interface  (9)  164  -167  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第11回)
    青木 直史, 藍 圭介  Interface  (10)  159  -161  2016  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第12回)
    青木 直史, 藍 圭介  Interface  (11)  102  -106  2016  [Not refereed][Invited]
  • AOKI Naofumi  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  114-  (485)  57  -60  2015/03/03  
    In order to generate reality in virtual world, it is important to understand how human feels reality. Focusing on some topics of food, this paper discusses the essence of reality from the viewpoint of food.
  • Q&Aコーナー
    青木 直史  日本音響学会誌  71-  (6)  299  2015  [Not refereed][Invited]
  • Pure Data
    青木 直史  Interface  (11)  85  2015  [Not refereed][Invited]
  • オープンソースのブロック型言語Pure Dataではじめるサウンド信号処理 (第1回)
    青木 直史, 藍 圭介  Interface  (12)  162  -165  2015  [Not refereed][Invited]
  • AOKI Naofumi, KASAI Hirotaka, INOUE Ikumi, TSUJI Junpei  Technical report of IEICE. Multimedia and virtual environment  114-  (239)  1  -6  2014/10/09  
    Prototyping some practical systems based on hardware and software technologies is an important skill for IT engineers. In order to develop such a skill, PBL (Project-Based Learning) education is expected to be an effective approach. This report introduces some examples about such educational topics at Hokkaido University.
  • Naofumi Aoki  IPSJ SIG technical reports  2014-  (21)  1  -2  2014/05/30  
    Manufacturing by prototyping is an important viewpoint for creating new entertainment. This paper describes recent topics about manufacturing by prototyping with some demonstration.
  • ZHU Zhi, YAMAMOTO Katsuhiko, UNOKI Masashi, AOKI Naofumi  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  113-  (480)  57  -62  2014/03/07  
    Speech scrambling aims to eliminate the intelligibility of original speech in order to preventing eavesdropping and copyright infringement. There is, however, a problem in that completely recovering scrambled speech into the original speech cannot be achieved with conventional methods. In this paper, we propose a speech scrambling method that uses the random-bit-shift of quantization bits with common keys. We evaluated the confidentiality and efficiency of the proposed method by using two objective measures, SER and PESQ. As a result we confirmed that speech signals could be scrambled into completely unintelligible sounds with the proposed method. Moreover, it is possible to restore a scrambled speech signal into the original one completely. In addition, we also confirmed that the scrambled speech signal could not be descrambled correctly with the wrong key. Finally, in order to increase the confidentiality, we investigated possibility of improved method, that randomizes the order of samples in addition to the proposed method.
  • AOKI Naofumi  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  113-  (415)  1  -4  2014/01/27  
    Acoustics is one of the curriculums for training speech therapists. It seems that sound demonstration is an effective way for teaching acoustics. This paper describes a case study of an educational program for beginners based on learning through listening.
  • 青木 直史, 葛西 紘貴, 井上 育美  ヒューマンインタフェース学会研究報告集  16-  1  -6  2014
  • YAMAMOTO Katsuhiko, ZHU Zhi, UNOKI Masashi, AOKI Naofumi  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  113-  (291)  59  -64  2013/11/14  
    Speech scramble method can encrypt the digital audio signal for guaranteeing the confidentiality of speech content. This is a very important technique for preventing eavesdropping and unauthorized copying. There are typical methods such as scramble methods based on speech codecs and reverse scrambling in the frequency domain. However, there seems to be impossible for completely recovering the scrambled speech signal into the original signal. Moreover, nobody can hear out the partial speech content from speech signals scrambled by these methods. This paper proposes a speech scramble method based on random-bit shift of quantization bits using the public key. This paper, then, proposes a semi-scramble method for speech signals based on phonemic restoration, by making flexible use of the proposed method. We evaluated confidentiality and efficiency of the proposed methods by carrying out two objective tests (SER and PESQ). As the results, we confirmed that the speech signals can be fully restored from the scrambled speech by the proposed methods. In addition, we also confirmed that the semi-scrambled speech can be perceived as the original one.
  • AOKI Naofumi  Technical report of IEICE. Multimedia and virtual environment  113-  (227)  1  -4  2013/09/26  
    This paper describes some topics about reality of food. From the viewpoint of human sensory characteristics such as sight and taste, this paper discusses some techniques for making reality of food.
  • AOKI Naofumi, MITANI Takahashi Kumi, FUJIMARU Manami, KISHIYA Takahisa, TSUJI Junpei, TAKAHASHI Tomohiro  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  113-  (138)  187  -192  2013/07/18  
    Problems related to information securities, such as cyber-terrorism, are becoming serious social issues. IT engineers are expected to be more skillful at dealing with such problems. In order to educate IT engineers, their community activities play important roles in knowledge exchange. This report introduces some examples about such educational topics.
  • AOKI Naofumi  Technical report of IEICE. CQ  113-  (123)  19  -24  2013/07/11  
    Wide spread of information devices has diversely changed the environment of sound media. Taking account of such situations, this paper discusses some viewpoints for considering the quality of sound media by introducing some case studies.
  • AOKI Naofumi  電子情報通信学会技術研究報告 : 信学技報  112-  (467)  19  -22  2013/03/07  
    Besides some industnal applications such as steganography and digital watermarking, the concept of information hiding is found in some entertainment applications including trick art. This paper describes an idea for making audio trick art by mono to stereo conversion.
  • Yamakami Kohei, Yamamoto Tsuyoshi, Aoki Naofumi  Proceedings of the IEICE General Conference  2013-  167  -167  2013/03/05  [Not refereed][Not invited]
  • Babaguchi Noboru, Suzuki Yo-iti, Echizen Isao, Hioki Hirohisa, Aoki Naofumi  電子情報通信学会技術研究報告 : 信学技報  112-  (420)  25  -30  2013/01/29  
    Abstract Technical Committee on Enriched Multimedia (EMM) prepared its roadmap about the research direction in the future. Based on the roadmap, this panel discussion exchanges opinions about the possibility of the information processing research area by the expert members of EMM.
  • AOKI Naofumi  Technical report of IEICE. Multimedia and virtual environment  112-  (221)  67  -70  2012/09/27  
    In order to generate reality in virtual world, it is important to understand how human feels reality. This paper considers the reality generated by stories by focusing on the human ability of making stories.
  • Aoki Naofumi  情報科学技術フォーラム講演論文集  11-  (3)  591  -592  2012/09/04
  • AOKI Naofumi  IEICE technical report. Social Implications of Technology and Information Ethics  112-  (127)  67  -70  2012/07/12  
    Discovering secret information may potentially satisfy the curiosity of consumer. This viewpoint can be a technique for value creation in entertainment applications. This paper discusses the possibility of value creation based on information hiding along with some related topics.
  • 森本 洋太, 青木 直史  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  112-  (125)  29  -33  2012/07
  • AOKI Naofumi  電子情報通信学会技術研究報告 : 信学技報  111-  (287)  37  -40  2011/11/14  
    Besides some industrial applications such as steganography and digital watermarking, the concept of information hiding is found in some entertainment applications including trick art. This paper describes an idea for making audio trick art based on information misreading technique.
  • AOKI Naofumi  工学教育研究講演会講演論文集  23-  (59)  750  -751  2011/08/22
  • 青木 直史, 森本 洋太  電子情報通信学会技術研究報告 = IEICE technical report : 信学技報  111-  (89)  37  -40  2011/06
  • 青木 直史, 森本 洋太  聴覚研究会資料 = Proceedings of the auditory research meeting  41-  (4)  275  -278  2011/06
  • 栗田 正樹, 青木 直史  O plus E  32-  (7)  799  -803  2010  [Not refereed][Invited]
  • 青木 直史  日本音響学会誌  66-  (8)  381  -386  2010  [Refereed][Invited]
  • KURITA Masaki, AOKI Naofumi  IEICE technical report  109-  (267)  33  -38  2009/10/30  
    We want to find the behavior of brain to think how to process the data of 2-dimensions movies.
  • Aoki Naofumi  Proceedings of the IEICE General Conference  2007-  (2)  431  -431  2007/03/07
  • フーリエ解析と音声信号処理
    青木 直史  数理科学  (532)  23  -28  2007  [Not refereed][Invited]
  • 2007PCカンファレンス講演会報告:「参加型情報化社会でWisdom Of Crowdsは構築できるか」
    青木 直史  コンピュータ&エデュケーション  23-  56  -60  2007  [Not refereed][Invited]
  • 北海道における情報教育の共通基盤形成に向けた調査2007
    森 夏節, 藤澤 法義, 曽我 聰起, 青木 直史, 棚橋 二朗, 小杉 直美, 皆川 雅章  2007PCカンファレンス論文集  409  -412  2007  [Not refereed][Not invited]
  • Aoki Naofumi  Proceedings of the IEICE General Conference  2006-  (2)  418  -418  2006/03/08
  • AOKI Naofumi  映像情報メディア学会技術報告  30-  (13)  125  -128  2006/02/20
  • KURITA Masaki, AOKI Naofumi  映像情報メディア学会技術報告  30-  (13)  129  -132  2006/02/20
  • OKADA Kazuhide, AOKI Naofumi  IEICE technical report. Speech  104-  (696)  59  -64  2005/02/25  
    To separate the original uttered voice by every phoneme is called 'Segmentation'. When this process is accurately done, for voice synthesis it is possible to concatenate every phoneme sequentially so as to be listened naturally and understandingly as one word or a sentence, and for voice recognition it is possible to hold the phoneme specialized dictionary so as to be recognized from waveform shape. Actually there are researchers or physicians who can distribute category of phoneme from the others, observing the periodical or not periodical of function itself, irregularity from the maximum poll's redundancy change, or the drastic change of the poll's number on waveform including uttered area. In this paper how to do efficient and reliable shape-oriented segmentation should be done as unit of phoneme is investigated including what kind of shape parameter we should adopt and how we should merge them for thresh-holding toward phoneme separation taking random taken 20 vocabulary which contain 150 phonemes totally.
  • Aoki Naofumi, Tanahashi Shin, Kishimoto Eiichi, Yasuda Seiki, Iwakoshi Mutsuroh  Proceedings of the IEICE General Conference  110  -110  2005
  • Aoki Naofumi, Tanahashi Shin, Kishimoto Eiichi, Kuwano Kouki, Yasuda Seiki, Iwakoshi Mutsurou  情報科学技術フォーラム一般講演論文集  3-  (3)  593  -594  2004/08/20
  • Aoki Naofumi, Tanahashi Shin, Kishimoto Eiichi, Yasuda Seiki, Iwakoshi Mutsuroh  Proceedings of the IEICE General Conference  2004-  (2)  66  -66  2004/03/08
  • AOKI Naofumi, TANAHASHI Shin, KISHIMOTO Eiichi, YASUDA Seiki, IWAKOSHI Mutsuroh  ITE technical report  28-  (6)  25  -28  2004/02/02
  • 2004PCカンファレンス全体会シンポジウム報告:「メディアと教育」 - 学びのコンテンツを考える -
    青木 直史  コンピュータ&エデュケーション  17-  59  -62  2004  [Not refereed][Invited]
  • TAMORI Hideaki, AOKI Naofumi, YAMAMOTO Tsuyoshi  IEICE transactions on fundamentals of electronics, communications and computer sciences  86-  (8)  2180  -2180  2003/08/01
  • AOKI Naofumi  日本音響学会研究発表会講演論文集  2003-  (1)  859  -860  2003/03/18
  • Matsumoto Kousuke, AOKI Naofumi, AOKI Yoshinao  Proceedings of the IEICE General Conference  2003-  (2)  34  -34  2003/03/03
  • YAMADA Yosuke, AOKI Naofumi, YAMAMOTO Tsuyoshi  ITE technical report  27-  (8)  145  -148  2003/02/03  [Not refereed][Not invited]
     
    This study focuses the expression recognition of facial images using higher-order local autocorrelation features and discriminant analysis. Higher-order local autocorrelation features are the higher-order extension of the autocorrelation function which is shift-invariant, and the range of the displacements is restricted within a 3×3 local region, the center of which is the reference point. Discriminant analysis linearly maps the primitive leaning data classified into some classes into new discriminant space, which maximizes the inner-class covariance while minimizing the between-class covariance. In this experiment, we photographs facial images of some test subjects with live basic expressions and calculates the recognition rate of expression using higher-order local autocorrelation features and discriminant analysis. We also consider the application to facial animation using the locus of expression changes in discriminant space.
  • TAMORI Hideaki, AOKI Naofumi, YAMAMOTO Tsuyoshi  ITE technical report  27-  (9)  113  -118  2003/02/03  [Not refereed][Not invited]
     
    Most robust digital watermarking, which is based on orthogonal transform, has high security because signature data is embedded in the domain of transforms. We have suggested watermarking techniques based on the number theoretic transform which is a type of orthogonal tranform. The number theoretic transform can be calculated without round-off error and has fragile nature of coefficient. In this paper, we introduce fragile and lossless watermarking techniques using the characteristics of the NTT.
  • Komaki Noriko, Aoki Naofumi, Yamamoto Tsuyoshi  情報技術レターズ  1-  103  -104  2002/09/13  [Not refereed][Not invited]
  • YAMADA Yosuke, AOKI Naofumi, YAMAMOTO Tsuyoshi  情報科学技術フォーラム一般講演論文集  2002-  (3)  57  -58  2002/09/13  [Not refereed][Not invited]
  • Tamori Hideaki, Aoki Naofumi, Yamamoto Tsuyoshi  情報科学技術フォーラム一般講演論文集  2002-  (3)  287  -288  2002/09/13  [Not refereed][Not invited]
  • KOMAKI Noriko, AOKI Naofumi, YAMAMOTO Tsuyoshi  ITE Technical Report  26-  (47)  47  -52  2002/07/05  [Not refereed][Not invited]
     
    Speech quality of VoIP is degraded by transmission errors such as packet loss that is inevitable in best-effort communications. We have studied how to decrease such degradation. This study investigated PWR (Pitch Waveform Replication) method that is employed as an error hiding technique. The previous version of PWR employs an interpolation where past speech data is only used. For the decrease of some artifacts such as echoic quality in the begging and end of phonation, this study has proposed a new version that takes account of an interpolation from future speech data. In order to shorten the delay of the pitch extraction from future speech data, the proposed method employs a template matching. From the experimental results of objective and subjective evaluation, it is indicated that the proposed method is potentially useful for the improvement of speech quality.
  • ギター演奏者の読譜能力および演奏能力の解析に基づいた高精度タブ譜作成自動化に関する研究
    青木 直史  財団法人ローランド芸術文化振興財団助成レポート平成13年度  13  -15  2002  [Not refereed][Invited]
  • Yamada Yosuke, Aoki Naofumi, Yamamoto Tsuyoshi  Proceedings of the Society Conference of IEICE  2001-  201  -201  2001/08/29
  • Okano Tetsuhiro, Aoki Naofumi, Burger Alexander, Yamamoto Tsuyoshi  Proceedings of the Society Conference of IEICE  2001-  238  -238  2001/08/29
  • Tamori Hideaki, Aoki Naofumi, Yamamoto Tsuyoshi  Proceedings of the Society Conference of IEICE  2001-  120  -120  2001/08/29  [Not refereed][Not invited]
  • Aoki Naofumi, Yamamoto Tsuyoshi, Aoki Yoshinao  Proceedings of the IEICE General Conference  2001-  (1)  183  -183  2001/03/07  [Not refereed][Not invited]
  • Aoki Naofumi, Yamamoto Tsuyoshi, Aoki Yoshinao  Proceedings of the Society Conference of IEICE  236  -236  2001  [Not refereed][Not invited]
  • Aoki Naofumi, Aoki Yoshinao, Yamamoto Tsuyoshi  Proceedings of the Society Conference of IEICE  2000-  183  -183  2000/09/07  [Not refereed][Not invited]
  • Aoki Naofumi, Aoki Yoshinao  Proceedings of the IEICE General Conference  213  -213  2000
  • Aoki Naofumi, Ifukube Tohru  Proceedings of the Society Conference of IEICE  1999-  (0)  217  -217  1999/08/16  [Not refereed][Not invited]
  • Aoki Naofumi, Ifukube Tohru, Takaya Kunio  Proceedings of the IEICE General Conference  1999-  (1)  232  -232  1999/03/08  [Not refereed][Not invited]
  • AOKI Naofumi, IFUKUBE Tohru  日本音響学会研究発表会講演論文集  1998-  (1)  251  -252  1998/03/01  [Not refereed][Not invited]
  • 青木 直史, 伊福部 達  言語・音声理解と対話処理研究会  (19)  9  -16  1997/10
  • AOKI Naofumi, IFUKUBE Tohru  日本音響学会研究発表会講演論文集  1997-  (2)  205  -206  1997/09/01  [Not refereed][Not invited]
  • AOKI Naofumi, IFUKUBE Tohru  日本音響学会研究発表会講演論文集  1997-  (1)  229  -230  1997/03/01  [Not refereed][Not invited]
  • AOKI Naofumi, IFUKUBE Tohru  Proceedings of the Society Conference of IEICE  1996-  464  -464  1996/09/18  [Not refereed][Not invited]
     
    合成音声における自然性の再現を目的として、母音合成時に不規則信号を音源信号に付加する試みがなされてきている。いわゆるmixed excitation音声合成方式として知られる方法は、バズ音源と白色雑音源の併用によってLPCボコーダ等の線形分離音声合成システムによる合成音声の音質の向上を目的としている。ここで提案する音声合成方式も同様に音源信号を周期信号と非周期信号の和で表現する。周期信号には-12dB/octの声帯フィルタを通過したパルス列信号を用いる。非周期信号には1/fゆらぎのクラスに分類される不規則信号を用いる。本方式は音声知覚に重要なacoustic cueを再現することによる合成母音の自然性の向上を目的としている。
  • AOKI Naofumi, IFUKUBE Tohru  日本音響学会研究発表会講演論文集  1996-  (2)  195  -196  1996/09/01  [Not refereed][Not invited]
  • 青木 直史, 伊福部 達  電子情報通信学会総合大会講演論文集  1996-  (1)  239  -239  1996/03/11  
    線形音声合成モデルに基づいた人工喉頭による合成音と比較すると、健常者の自然な音声信号はピッチゆらぎや波形ゆらぎを有し、これらが音声の自然性の一因であるとの報告がある。本稿では健常者の母音/a/の振幅ゆらぎをそのまま人工喉頭の音源信号の振幅ゆらぎとして計算機シミュレーションにより音声合成し、合成音に対する心理実験を行った。バズ音質の改善に有効とされるRosenberg波を音源信号とし、測定から得た1/f^δ特性を持つゆらぎを音源信号の振幅ゆらぎとして音声合成したところ、音源信号の周期性により知覚されるバズ音質が改善されることが明らかになった。
  • Aoki Naofumi, Ifukube Tohru  Proceedings of the IEICE General Conference  1996-  (1)  238  -238  1996/03/11  [Not refereed][Not invited]
     
    線形音声合成モデルに基づく音声合成の応用として人工喉頭がある。その合成音質はLPCボコーダ等の線形音声合成システムにおける合成音質と同様の問題があることが報告されている。特に人工喉頭における音源信号は発声の大部分を占める有声音合成を目的とするために周期信号としてある。そのために生じるバズ音質が合成音声の自然性を低下させる原因となり改善すべき課題となっている。本稿では音源信号にバズ音の改善に有効とされるRosenberg波を適用し、さらに振幅ゆらぎを付加し音声合成を試みた。結果としてゆらぎを有する音声信号では自然性に影響を与える側波構造を生じていることが明らかになった。

Books etc

  • ArduinoとProcessingではじめるプロトタイピング入門
    青木 直史 (Single work)
    講談社 2017
  • ゼロからはじめる音響学
    青木 直史 (Single work)
    講談社 2014
  • レット症候群ハンドブックⅡ
    青木 直史 (Joint translation)
    日本レット症候群協会 2013
  • Multimedia Information Hiding Technologies and Methodologies for Controlling Data
    AOKI Naofumi (Joint workEnhancement of speech quality in telephony communications by steganography)
    IGI Global 2013
  • サウンドプログラミング入門 - 音響合成の基本とC言語による実装 -
    青木 直史 (Single work)
    技術評論社 2013
  • Recent Advances in Steganography
    AOKI Naofumi (Joint workLossless steganography for speech communications)
    InTech 2012
  • 冗長性から見た情報技術 - やさしく理解する原理と仕組み -
    青木 直史 (Single work)
    講談社 2011
  • ブレッドボードではじめるマイコンプログラミング
    青木 直史 (Single work)
    技術評論社 2010
  • C言語ではじめる音のプログラミング - サウンドエフェクトの信号処理 -
    青木 直史 (Single work)
    オーム社 2008
  • H8マイコンによるネットワーク・プログラミング - C言語ではじめる組み込みマイコン入門 -
    青木 直史 (Single work)
    技術評論社 2008
  • ディジタル・サウンド処理入門 - 音のプログラミングとMATLAB(Octave・Scilab)における実際 -
    青木 直史 (Single work)
    CQ出版社 2006
  • Acoustical ray tracing system for visualizing the simulated sound reflection from a plane rock wall in acoustical archaeology
    Acoustical Imaging, (Eds. Halliwell and Wells), Kluwer Academic/Plenum Publishers 2000

Presentations

  • テーラーメイド音声合成のための音声データベース構築の一検討  [Not invited]
    青木 直史, 穴沢 早紀, 髙井 佑洸, 須藤 健次
    電気・情報関係学会北海道支部連合大会  2019/11
  • Web上に投稿された動画と字幕データによる音声データベース構築  [Not invited]
    髙井 佑洸, 青木 直史, 土橋 宜典
    電気・情報関係学会北海道支部連合大会  2019/11
  • ニューラルネットワークによる音通信の識別率向上に関する一検討  [Not invited]
    尾関 剛成, 青木 直史, 土橋 宜典
    電気・情報関係学会北海道支部連合大会  2019/11
  • 歪みエフェクタの機械学習と学習のデータに関する一考察  [Not invited]
    松永 悠斗, 青木 直史, 土橋 宜典
    電気・情報関係学会北海道支部連合大会  2019/11
  • 特徴量に基づいた楽曲要約手法および楽曲類似度の計算手法に関する一検討  [Not invited]
    菊池 雄大, 青木 直史, 土橋 宜典
    電気・情報関係学会北海道支部連合大会  2019/11
  • 楽曲の要約過程におけるクラスタリング手法に関する一検討  [Not invited]
    菊池 雄大, 青木 直史, 土橋 宜典, 山本 強
    日本音響学会春季研究発表会  2019/03
  • トライアングルの音響分析に関する一考察  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2019/03
  • Deep Neural Networkを用いた歪みエフェクタのデジタルモデリングに関する一検討  [Not invited]
    松永 悠斗, 青木 直史, 土橋 宜典, 山本 強, 小嶋 徹也
    2019/03
  • 音声データベースの音素ラベリングに関する一考察  [Not invited]
    買手 健太, 青木 直史, 土橋 宜典, 山本 強
    日本音響学会春季研究発表会  2019/03
  • リズムゲームの譜面データの機械学習による自動生成手法の評価  [Not invited]
    有働 篤人, 青木 直史, 土橋 宜典, 山本 強
    日本音響学会春季研究発表会  2019/03
  • インタラクティブ音声合成システム「Voice Pad」の可能性  [Not invited]
    青木 直史, 藍 圭介
    日本音響学会春季研究発表会  2019/03
  • スマートスピーカーから学ぶ音声科学  [Invited]
    青木 直史
    札幌市青少年科学館 先端科学技術講座  2019/02
  • プログラミングボランティアのお誘い  [Not invited]
    青木 直史
    第24回NORTHインターネット・シンポジウム2018  2018
  • サウンドプログラミングによる言語聴覚士のための音響教育教材の開発  [Not invited]
    青木 直史, 藍 圭介
    日本音響学会春季研究発表会  2018
  • ブロック構造に基づいた非線形歪み回路のモデリング  [Not invited]
    松永 悠斗, 青木 直史, 土橋 宜典, 山本 強
    日本音響学会春季研究発表会  2018
  • 楽器音を対象とした「ほぼあらゆる音をつくる」ことの挑戦  [Not invited]
    青木 直史
    音学シンポジウム2018  2018
  • 歪みエフェクタのデジタルモデリングに関する研究  [Not invited]
    松永 悠斗, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2018
  • 自動音声セグメンテーションに関する一考察  [Not invited]
    買手 健太, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2018
  • MFCCを用いた楽曲内部の類似度の計算に関する一検討  [Not invited]
    菊池 雄大, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2018
  • リズムゲームの譜面データの機械学習による自動生成  [Not invited]
    有働 篤人, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2018
  • マルチタッチデバイスを利用したインタラクティブ音声合成システムの開発  [Not invited]
    青木 直史, 藍 圭介
    電気・情報関係学会北海道支部連合大会  2018
  • Pure Dataによる言語聴覚士のための音響教育教材の開発  [Not invited]
    青木 直史, 藍 圭介
    日本音響学会春季研究発表会  2017
  • ICT/IoTとは  [Not invited]
    青木 直史
    「ICT/IoT×北海道づくり」を目指す勉強会  2017
  • プラグインを作るための基礎講座 - エフェクタのしくみを理解する  [Not invited]
    青木 直史, 塚原 義弘
    Future Sound Interface  2017
  • 音響信号のダイナミクスに基づいたテンポ及び楽曲構造推定  [Not invited]
    菊池 雄大, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2017
  • 正弦波モデルによる歌声のMIDIデータ化  [Not invited]
    能戸 宏之, グドール 聖哉, 青木 直史, 元木 邦俊, 佐藤 晴彦
    電気・情報関係学会北海道支部連合大会  2017
  • 非線形歪み回路のディジタルモデリングに関する一検討  [Not invited]
    松永 悠斗, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2017
  • 音韻ラベリングのための音声セグメンテーションに関する一考察  [Not invited]
    青木 直史, 須藤 健次
    電気・情報関係学会北海道支部連合大会  2017
  • 汎用PCにおける音波を用いたジェスチャー検出に関する一検討  [Not invited]
    有働 篤人, 青木 直史, 土橋 宜典, 山本 強
    電気・情報関係学会北海道支部連合大会  2017
  • 成熟社会のモノづくり  [Not invited]
    青木 直史
    第22回NORTHインターネット・シンポジウム2016  2016
  • 北海道における「声を残す」プロジェクトから見えてきた課題  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2016
  • Pure Dataによるサウンドプログラミングのリテラシー教育について  [Not invited]
    青木 直史, 藍 圭介
    電子情報通信学会ソサイエティ大会  2016
  • 想いをカタチにするものづくり革命  [Invited]
    青木 直史
    第90回サイエンス・カフェ札幌  2016
  • 音韻ラベリングのための音声波形エディタの開発  [Not invited]
    青木 直史, 須藤 健次
    電気・情報関係学会北海道支部連合大会  2016
  • 音をカガクする×音をアートする  [Invited]
    青木 直史, 塚原 義弘
    三岸好太郎美術館 音楽のある土曜セミナー  2015
  • 「ほぼあらゆる音をつくる」ことの可能性  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2015
  • ほぼあらゆる音をつくる  [Invited]
    青木 直史
    北海道新聞社会福祉振興基金助成事業「声を残すことへの挑戦」報告会  2015
  • 妄想をカタチにする  [Invited]
    青木 直史
    第4回NetSci研究会/CCS研究会合同ワークショップナイトセッション  2015
  • MATLABによるサウンドプログラミング  [Not invited]
    青木 直史
    日本音響学会秋季研究発表会  2015
  • ビジュアルプログラミング言語Pure Dataによるサウンドプログラミング  [Invited]
    青木 直史, 藍 圭介
    日本音響学会第144回技術講習会  2015
  • やっぱヒューマンでしょ:MVEが名称変更を議論する理由  [Invited]
    小林 稔, 上岡 玲子, 酒田 信親, 三上 弾, 青木 直史, 全 炳東, 中村 祐一, 柳田 康幸, 井原 雅行
    電子情報通信学会HCGシンポジウム2015  2015
  • 北海道における「声を残す」プロジェクト  [Not invited]
    青木 直史
    電子情報通信学会HCGシンポジウム2015  2015
  • 言語聴覚士のための音響学教育  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2014
  • ギターエフェクタによるサウンドメイキング術  [Invited]
    青木 直史, 塚原 義弘
    日本音響学会秋季研究発表会  2014
  • 音響教育における音楽の役割  [Invited]
    青木 直史
    日本音響学会秋季研究発表会  2014
  • 言語聴覚士国家試験のための音響教育  [Not invited]
    青木 直史
    日本音響学会秋季研究発表会  2014
  • レゴマインドストームによるPBL教育の可能性  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2014
  • Recent Movement of Japanese Manufacturing with Information Technologies  [Invited]
    AOKI Naofumi
    A Short Seminar, The Centre for Speech Technology Research, The university of Edinburgh  2014
  • 物語から生み出されるリアリティ  [Not invited]
    青木 直史
    電子情報通信学会HCGシンポジウム2014  2014
  • サウンドプログラミング with MATLAB  [Invited]
    青木 直史
    九州大学芸術工学部談話会  2014
  • SuperColliderによるデータ可聴化の可能性  [Not invited]
    森本 洋太, 青木 直史
    日本音響学会春季研究発表会  2013
  • 音響合成を題材としたサウンドプログラミング演習  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2013
  • マルチビームSSB合成方式パラメトリックスピーカにおける構造最適化  [Not invited]
    山上 晃平, 山本 強, 青木 直史
    電子情報通信学会総合大会  2013
  • 量子化ビットのランダムシフトによる音声スクランブル法の検討  [Not invited]
    朱 治, 山本 克彦, 鵜木 祐史, 青木 直史
    電気関係学会北陸支部連合大会  2013
  • 韻修復現象に着目した音声半開示スクランブル法の検討  [Not invited]
    山本 克彦, 朱 治, 鵜木 祐史, 青木 直史
    電気関係学会北陸支部連合大会  2013
  • 隠すことによる価値創造の可能性  [Invited]
    青木 直史
    第14回情報フォトニクス研究グループ研究会  2013
  • 音響教育におけるサウンドプログラミング  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2013
  • マルチビームSSB合成方式パラメトリックスピーカにおける音響ビーム特性の改善  [Not invited]
    山上 晃平, 山本 強, 青木 直史
    電気・情報関係学会北海道支部連合大会  2013
  • 情報ハイディング技術を利用した音声メディアの高付加価値化  [Invited]
    青木 直史
    音情報処理分野・鵜木研究室ショートセミナー  2012
  • SuperColliderによるサウンドプログラミングの可能性  [Not invited]
    青木 直史, 森本 洋太
    日本音響学会春季研究発表会  2012
  • オーディオトリックアートに関する一考察  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2012
  • モジュロ演算によるオーディオトリックアート  [Not invited]
    青木 直史
    電子情報通信学会情報処理学会情報科学技術フォーラム  2012
  • 情報ミスリーディングによるオーディオトリックアートの可能性  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2012
  • 身近な情報ハイディング技術  [Not invited]
    青木 直史
    ひらめき☆ときめきサイエンス  2012
  • モノづくりによる価値創造の可能性  [Not invited]
    青木 直史
    電子情報通信学会マルチメディア情報ハイディング研究会(第12回)  2011
  • 成熟社会におけるモノづくりの可能性  [Invited]
    青木 直史
    第4回組込み事例・応用講演会  2011
  • EMMが目指すマルチメディア情報処理の未来  [Invited]
    馬場口 登, 岩村 惠市, 西村 明, 越前 功, 新見 道治, 西村 竜一, 日置 尋久, 青木 直史
    電子情報通信学会情報処理学会情報科学技術フォーラム  2011
  • 電子情報系学生のためのマイコン実習  [Not invited]
    青木 直史
    工学教育研究講演会  2011
  • 情報ミスリーディングによるオーディオトリックアート  [Not invited]
    青木 直史
    電子情報通信学会ソサイエティ大会  2011
  • Audio Trick Art Based on Information Misreading Technique  [Not invited]
    AOKI Naofumi
    A Short Seminar, Department of Computer Science, School of Computer and Communication Engineering, University of Science & Technology Beijing  2011
  • サイバー鳴子@YOSAKOIソーラン祭り  [Not invited]
    青木 直史
    Make: Tokyo Meeting 07  2011
  • 言葉遊びと情報ハイディング  [Not invited]
    青木 直史
    電子情報通信学会マルチメディア情報ハイディング研究会(第10回)  2010
  • 色弱の見え方と可能性 - カラーユニバーサルデザイン -  [Not invited]
    栗田 正樹, 青木 直史
    電子情報通信学会マルチメディア情報ハイディング研究会(第10回)  2010
  • 音響プログラミング入門  [Invited]
    青木 直史
    日本音響学会秋季研究発表会  2010
  • プロトタイピングの可能性に関する一考察  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2010
  • 言葉遊びによる情報ハイディング  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2010
  • サイバー鳴子@YOSAKOIソーラン祭り  [Not invited]
    青木 直史
    Make: Tokyo Meeting 06  2010
  • サウンドエフェクトを題材としたプログラミング演習  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2009
  • データハイディング技術を利用した音声メディアの高付加価値化  [Invited]
    青木 直史
    電子情報通信学会情報処理学会情報科学技術フォーラム  2009
  • YOSAKOIソーラン祭りにおけるサイバー鳴子の展開  [Not invited]
    青木 直史
    エンタテインメントコンピューティング2009  2009
  • サウンドエフェクトの信号処理  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2009
  • 全波整流にもとづく狭帯域電話音声の帯域拡張  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2009
  • 折り返し2進符号の冗長性にもとづくロスレスステガノグラフィ  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2009
  • リアルバーチャリティの可能性  [Not invited]
    青木 直史
    電子情報通信学会HCGシンポジウム2009  2009
  • 色覚の多様性とカラーユニバーサルデザイン  [Not invited]
    栗田 正樹, 青木 直史
    電子情報通信学会HCGシンポジウム2009  2009
  • MATLABによるサウンド処理のプログラミング演習  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2008
  • ネットワークプログラミングのための組み込みマイコンボードの開発  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2008
  • 掲示板サイトにみるサウンドプログラミングの話題  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2008
  • 音情報の秘匿技術に関する一考察  [Not invited]
    青木 直史
    電子情報通信学会マルチメディア情報ハイディング研究会(第5回)  2008
  • 電話音声の帯域拡張に関する一考察  [Not invited]
    青木 直史
    電子情報通信学会総合大会  2007
  • セカンドライフにみるWeb2.0の世界  [Not invited]
    青木 直史
    2007PCカンファレンス  2007
  • PICマイコンによる学生実験  [Not invited]
    青木 直史
    2007PCカンファレンス  2007
  • 北海道における情報教育の共通基盤形成に向けた調査2007  [Not invited]
    森 夏節, 藤澤 法義, 曽我 聰起, 青木 直史, 棚橋 二朗, 小杉 直美, 皆川 雅章
    2007PCカンファレンス  2007
  • G.711に対するロスレスステガノグラフィの一検討  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2007
  • 仮想世界のモノづくり  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2007
  • ステガノグラフィを用いたVoIPにおける音声の帯域拡張法  [Not invited]
    青木 直史
    電子情報通信学会総合大会  2006
  • IP電話キットの開発  [Not invited]
    青木 直史, 大村 功
    2006PCカンファレンス  2006
  • 北海道における情報教育の共通基盤形成に向けた調査  [Not invited]
    森 夏節, 藤澤 法義, 曽我 聰起, 青木 直史, 片桐 実穂, 小杉 直美, 棚橋 二朗, 皆川 雅章
    2006PCカンファレンス  2006
  • A band extension technique for G.711 speech based on full wave rectification and steganography  [Invited]
    AOKI Naofumi
    A Short Seminar, Department of Computer Engineering, Myongji University  2006
  • ディジタル・サウンド処理入門のためのプログラム開発環境  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2006
  • 非線形処理による電話音声の帯域拡張  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2006
  • H8マイコンによるIP電話スタータキットの開発  [Not invited]
    青木 直史, 中野 隆司
    電気・情報関係学会北海道支部連合大会  2006
  • 赤外線通信版サイバー鳴子の開発  [Not invited]
    青木 直史, 棚橋 真
    電気・情報関係学会北海道支部連合大会  2006
  • サウンド処理入門のプログラム開発環境  [Not invited]
    青木 直史
    PCカンファレンス北海道2006  2006
  • 学生実験におけるPICマイコン実習  [Not invited]
    青木 直史
    PCカンファレンス北海道2006  2006
  • カラーユニバーサルデザイン - 色覚異常者の見え方 -  [Not invited]
    栗田 正樹, 青木 直史
    PCカンファレンス北海道2006  2006
  • ステガノグラフィによるVoIP音声の帯域拡張  [Not invited]
    青木 直史
    電子情報通信学会第21回信号処理シンポジウム  2006
  • アミューズメント分野におけるIT系モノづくり  [Invited]
    青木 直史
    第7回計測自動制御学会システムインテグレーション部門講演会  2006
  • My current projects related with sound  [Not invited]
    AOKI Naofumi
    Digital Signal Processing Research Seminar, Center for Computer Research in Music and Acoustics, Department of Music, Stanford University  2005
  • 画像処理によるギター運指動作のキャプチャリング  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 安田 星季, 岩越 睦郎
    電子情報通信学会総合大会  2005
  • ステガノグラフィを利用したVoIPにおけるバースト性パケット損失の一隠蔽法  [Not invited]
    青木 直史
    電子情報通信学会 第18回 回路とシステム(軽井沢)ワークショップ  2005
  • バーチャルカンパニー「鳴子ファクトリー」の誕生  [Not invited]
    青木 直史
    2005PCカンファレンス  2005
  • SuperHを用いた高品質VoIP端末の開発  [Invited]
    青木 直史
    SuperHオープンフォーラム  2005
  • ハードウェアVoIP端末の開発  [Not invited]
    青木 直史, 大村 功, 新井 浩成, 長内 研, 高野 好平, 滑川 知広
    電子情報通信学会ソサイエティ大会  2005
  • HMDと地図情報を組み合わせた全天候ビュアーの開発  [Not invited]
    福本 義隆, 高野 好平, 滑川 知広, 青木 由直, 青木 直史
    電気・情報関係学会北海道支部連合大会  2005
  • VoIP評価ボードの開発  [Not invited]
    青木 直史, 大村 功, 新井 浩成, 長内 研, 高野 好平, 滑川 知広
    電気・情報関係学会北海道支部連合大会  2005
  • ZigBee評価ボードの開発  [Not invited]
    青木 直史, 桑野 晃希, 大村 功, 新井 浩成, 長内 研, 高野 好平, 滑川 知広
    電気・情報関係学会北海道支部連合大会  2005
  • アミューズメント分野における組込みプロダクトの開発  [Not invited]
    青木 直史
    電気・情報関係学会北海道支部連合大会  2005
  • アミューズメント分野におけるモノづくりの可能性  [Not invited]
    青木 直史
    PCカンファレンス北海道2005  2005
  • カナダ・サスカツーンの企業視察  [Not invited]
    青木 直史
    Aoki Digital Media Academy  2004
  • ステガノグラフィを用いたVoIPにおけるパケット損失の一隠蔽法  [Not invited]
    青木 直史
    Aoki Digital Media Academy  2004
  • ギター演奏動作のキャプチャリング装置の開発  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 安田 星季, 岩越 睦郎
    電子情報通信学会総合大会  2004
  • XMLによる音声データベースのオープンコンテンツ化  [Not invited]
    青木 直史, 伊藤 博之, 澤田 周, 須藤 健次
    電子情報通信学会総合大会  2004
  • ギター演奏における運指キャプチャ装置の開発  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 安田 星季, 岩越 睦郎
    情報処理北海道シンポジウム2004  2004
  • 札幌ITカロッツェリアの取り組みについて  [Not invited]
    青木 直史
    2004PCカンファレンス  2004
  • サイバー鳴子の開発について  [Not invited]
    青木 直史
    ITものづくり講演会  2004
  • 演舞者のパフォーマンスをアシストするIT楽器の開発  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 桑野 晃希, 安田 星季, 岩越 睦郎
    電子情報通信学会情報処理学会情報科学技術フォーラム  2004
  • 数論変換による脆弱型電子透かしを用いた改ざん位置検出法  [Invited]
    青木 直史
    イノベーション・ジャパン2004  2004
  • VoIP端末の開発  [Not invited]
    青木 直史, 中野 隆司, 大村 功, 新井 浩成, 高野 好平, 安田 星季, 岩越 睦郎
    電気・情報関係学会北海道支部連合大会  2004
  • サイバーギターの開発  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 安田 星季, 岩越 睦郎
    電気・情報関係学会北海道支部連合大会  2004
  • サイバー鳴子の開発  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 桑野 晃希, 安田 星季, 岩越 睦郎
    電気・情報関係学会北海道支部連合大会  2004
  • Voice Label Editorの開発  [Not invited]
    青木 直史, 須藤 健次, 伊藤 博之, 井口 勇
    電気・情報関係学会北海道支部連合大会  2004
  • 新聞報道に見る北海道の情報教育  [Not invited]
    青木 直史
    PCカンファレンス北海道2004  2004
  • 札幌ITカロッツェリアにおける産学官の協同について  [Not invited]
    青木 直史
    Aoki Digital Media Academy  2004
  • MOGAによるギタータブ譜の自動作成  [Not invited]
    青木 直史
    日本音響学会春季研究発表会  2003
  • VoIPにおけるステガノグラフィを用いたパケット損失の一隠蔽法  [Not invited]
    青木 直史, 大宮 尚弘, 中野 隆司, 小牧 憲子, 山本 強, 青木 由直
    電子情報通信学会総合大会  2003
  • キーワードによる効果音データベース検索システムの開発  [Not invited]
    青木 直史, 伊藤 博之, 佐藤 隆文, アレキサンダー・ブルガー
    電子情報通信学会総合大会  2003
  • MPEGへのロスレス型電子透かしを用いたユーザー認証の検討  [Not invited]
    松本 康佑, 青木 直史, 青木 由直
    電子情報通信学会総合大会  2003
  • オブジェクト指向データベースを用いた効果音検索システムの構築  [Not invited]
    青木 直史, 伊藤 博之, 佐藤 隆文, アレキサンダー・ブルガー
    情報処理北海道シンポジウム2003  2003
  • アバタ界の現実感について  [Not invited]
    栗田 正樹, 青木 直史
    情報処理北海道シンポジウム2003  2003
  • 化身話に基づくユビコンラーニングに関する研究  [Not invited]
    劉 学軍, 青木 由直, 青木 直史
    情報処理北海道シンポジウム2003  2003
  • ITビジネスにおける音声音響アプリケーションの可能性  [Not invited]
    青木 直史
    Aoki Digital Media Academy  2003
  • 工学的アプローチによる音声音響情報処理  [Not invited]
    青木 直史
    第81回森羅万象セミナー  2003
  • XMLによる音声データベースの構築  [Not invited]
    青木 直史
    2003PCカンファレンス  2003
  • ピッチ波形複製法に基づくステガノグラフィを用いたVoIPにおけるパケット損失の一隠蔽法  [Not invited]
    青木 直史, 大宮 尚弘, 阿部 真澄, 中野 隆司
    電子情報通信学会情報処理学会情報科学技術フォーラム  2003
  • ステガノグラフィを用いたVoIP音声の広帯域化  [Not invited]
    青木 直史, 大宮 尚弘, 阿部 真澄, 中野 隆司
    電気関係学会北海道支部連合大会  2003
  • 波形置換に基づくVoIP音声のエラー隠蔽法の評価  [Not invited]
    青木 直史, 大宮 尚弘, 阿部 真澄, 中野 隆司
    電気関係学会北海道支部連合大会  2003
  • 効果音検索システムのためのオントロジーエディタの開発  [Not invited]
    青木 直史, 伊藤 博之, 佐藤 隆文, アレキサンダー・ブルガー
    電気関係学会北海道支部連合大会  2003
  • 音声合成用音声データベースの標準化に関する一検討  [Not invited]
    青木 直史, 伊藤 博之, 佐藤 隆文, アレキサンダー・ブルガー
    電気関係学会北海道支部連合大会  2003
  • ギター演奏動作のキャプチャリングに関する一検討  [Not invited]
    青木 直史, 棚橋 真, 岸本 英一, 安田 星季, 岩越 睦郎
    電気関係学会北海道支部連合大会  2003
  • 非線形音響合成に関する一考察  [Not invited]
    青木 直史
    電気関係学会北海道支部連合大会  2003
  • アバタ世界の物理法則  [Not invited]
    栗田 正樹, 青木 直史
    電気関係学会北海道支部連合大会  2003
  • 音作りにおけるコンピュータの利用  [Not invited]
    青木 直史
    PCカンファレンス北海道2003  2003
  • A packet loss concealment technique for VoIP using steganography  [Invited]
    AOKI Naofumi
    Smart Board Presentation in TRLabs  2003
  • ステガノグラフィを用いたVoIPにおけるパケット消失の一隠蔽法  [Not invited]
    青木 直史, 小牧 憲子, 山本 強, 青木 由直
    電子情報通信学会総合大会  2002
  • 数論変換を用いた脆弱型電子透かしによる静止画像の改ざん位置検出  [Not invited]
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会総合大会  2002
  • MPEG-4の仕様に準拠した顔線画アニメーション生成  [Not invited]
    山田 陽介, 青木 直史, 山本 強
    電子情報通信学会総合大会  2002
  • 無線LANとパソコン利用ディジタル信号処理授業の試みII  [Not invited]
    本間 宏俊, 青木 由直, 青木 直史, 山本 強
    電子情報通信学会総合大会  2002
  • 遺伝的アルゴリズムを用いたギタータブ譜の一作成方法  [Not invited]
    青木 直史, 青木 由直, 山本 強
    情報処理北海道シンポジウム2002  2002
  • VoIPにおける欠落した音声データの一補間方式に関する研究  [Not invited]
    青木 直史
    小牧 憲子, 青木 直史, 山本 強  2002
  • ギタータブ譜の自動作成  [Not invited]
    青木 直史
    Aoki Digital Media Academy  2002
  • Recent speech applications in Japan  [Not invited]
    AOKI Naofumi
    Monthly Seminar of Laboratory of Acoustics and Audio Signal Processing, Helsinki University of Technology  2002
  • 静止画像の改ざん位置検出と訂正を考慮した数論変換に基づく脆弱型電子透かし  [Not invited]
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会情報処理学会情報科学技術フォーラム  2002
  • 高次局所自己相関特徴と多重解像度画像を利用した顔の表情認識に関する一考察  [Not invited]
    山田 陽介, 青木 直史, 山本 強
    電子情報通信学会情報処理学会情報科学技術フォーラム  2002
  • 2side PWR法によるVoIPにおけるパケット損失の隠蔽  [Not invited]
    小牧 憲子, 青木 直史, 山本 強
    電子情報通信学会情報処理学会情報科学技術フォーラム  2002
  • ITビジネスへ向けた音声アプリケーションの可能性  [Not invited]
    青木 直史
    電気関係学会北海道支部連合大会  2002
  • ギタータブ譜自動作成におけるMOGAの適用  [Not invited]
    青木 直史
    電気関係学会北海道支部連合大会  2002
  • 二つのセキュリティ技術:電子透かしと生体認証  [Not invited]
    青木 直史, 田森 秀明, 山田 陽介, 山本 強
    電気関係学会北海道支部連合大会  2002
  • エラー隠蔽を考慮したVoIP端末の開発  [Not invited]
    青木 直史, 中野 隆司, 小牧 憲子, 山本 強, 青木 由直
    電気関係学会北海道支部連合大会  2002
  • 効果音データベースのためのキーワード検索システムの開発  [Not invited]
    青木 直史, 伊藤 博之, 佐藤 隆文, アレキサンダー・ブルガー
    電気関係学会北海道支部連合大会  2002
  • 2side PWR法を用いたパケット損失隠蔽のPESQによる音質評価  [Not invited]
    小牧 憲子, 青木 直史, 山本 強
    電気関係学会北海道支部連合大会  2002
  • ユビコン環境での化身話利用のための絵文字システム  [Not invited]
    青木 由直, 劉 学軍, 侯 進, 張 慧蓮, 青木 直史, 金 商雲
    電気関係学会北海道支部連合大会  2002
  • MATLABによるディジタル信号処理教育  [Not invited]
    青木 直史
    PCカンファレンス北海道2002  2002
  • 多目的最適化GAによるギタータブ譜自動作成  [Not invited]
    青木 直史, 青木 由直, 山本 強
    電子情報通信学会 第17回 ディジタル信号処理シンポジウム  2002
  • 数論変換による脆弱型電子透かしに関する考察と提案  [Not invited]
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会 第17回 ディジタル信号処理シンポジウム  2002
  • 高次局所自己相関特徴と多重解像度画像を用いた顔画像の表情認識  [Not invited]
    山田 陽介, 青木 直史, 山本 強
    電子情報通信学会 第17回 ディジタル信号処理シンポジウム  2002
  • VoIPにおけるステガノグラフィを用いたパケット損失の隠蔽  [Not invited]
    小牧 憲子, 青木 直史, 山本 強
    電子情報通信学会 第17回 ディジタル信号処理シンポジウム  2002
  • クライアント/サーバー音声合成システムの構築に関する一考察  [Not invited]
    尾関 朋香, 青木 直史, アレキサンダー・ブルガー, 山本 強
    電子情報通信学会 第17回 ディジタル信号処理シンポジウム  2002
  • ロスレス型電子透かしを用いたユーザー認証の検討  [Not invited]
    松本 康祐, 青木 直史, 青木 由直
    電子情報通信学会 第17回 ディジタル信号処理シンポジウム  2002
  • XMLによる音声データの記述と音声ブラウザの開発  [Not invited]
    青木 直史, 山本 強, 青木 由直
    電子情報通信学会総合大会  2001
  • 無線LANとパソコン利用ディジタル信号処理授業の試み  [Not invited]
    本間 宏俊, 青木 由直, 青木 直史, 山本 強
    電子情報通信学会総合大会  2001
  • XMLによる音声データの記述とテキスト音声合成への応用  [Not invited]
    青木 直史, 山本 強, 青木 由直
    情報処理北海道シンポジウム2001  2001
  • 計算機合成ホログラムを用いた動画像に対する電子透かし  [Not invited]
    田森 秀明, 青木 直史, 山本 強
    情報処理北海道シンポジウム2001  2001
  • 顔グラフによる気象データの可視化と気象指数の設計に関する一考察  [Not invited]
    山田 陽介, 青木 直史, 山本 強
    情報処理北海道シンポジウム2001  2001
  • 短区間マッチングによる音声波形ゆらぎ解析と音声合成への応用  [Not invited]
    青木 直史, 山本 強, 青木 由直
    電子情報通信学会 第14回 回路とシステム(軽井沢)ワークショップ  2001
  • 数論変換を用いた静止画像の改ざん検出に関する一考察  [Not invited]
    田森 秀明, 青木 直史, 山本 強
    画像電子学会第29回年次大会  2001
  • 顔の3次元モデルを用いた表情合成に関する一考察  [Not invited]
    山田 陽介, 青木 直史, 山本 強
    画像電子学会第29回年次大会  2001
  • 近似カナ表記法による英語音声教育の可能性  [Not invited]
    青木 直史
    2001PCカンファレンス  2001
  • ステガノグラフィを用いた音声データのフレーム消失隠蔽法  [Not invited]
    青木 直史, 山本 強, 青木 由直
    電子情報通信学会ソサイエティ大会  2001
  • Lisp XMLインタフェースを用いた音声合成システムの構築  [Not invited]
    岡野 哲大, 青木 直史, アレキサンダー・ブルガー, 山本 強
    電子情報通信学会ソサイエティ大会  2001
  • フェルマー数変換を用いた静止画像の改ざん検出可能な文字コード埋め込み法  [Not invited]
    田森 秀明, 青木 直史, 山本 強
    電子情報通信学会ソサイエティ大会  2001
  • 山田 陽介, 青木 直史, 山本 強  [Not invited]
    顔画像中の特徴点追跡によるMPEG, 顔アニメーション生成
    電子情報通信学会ソサイエティ大会  2001
  • クライアント/サーバー音声合成システムの開発  [Not invited]
    青木 直史, アレキサンダー・ブルガー, 山本 強, 青木 由直
    電気関係学会北海道支部連合大会  2001
  • ステガノグラフィを用いたVoIPにおけるパケット消失隠蔽法  [Not invited]
    青木 直史, 山本 強, 青木 由直
    電気関係学会北海道支部連合大会  2001
  • XMLによる音楽情報の電子文書化に関する一考察  [Not invited]
    青木 直史, 山本 強, 青木 由直
    電気関係学会北海道支部連合大会  2001
  • 顔画像の特徴点追跡によるMPEG-4顔アニメーション生成  [Not invited]
    山田 陽介, 青木 直史, 山本 強
    電気関係学会北海道支部連合大会  2001
  • 西塚 雄一, 青木 直史, 山本 強  [Not invited]
    スクランブル信号による音声への電子透かしに関する一考察
    電気関係学会北海道支部連合大会  2001
  • インターネットを利用した音声合成システムの構築  [Not invited]
    青木 直史, アレキサンダー・ブルガー, 山本 強, 青木 由直
    電子情報通信学会 第16回 ディジタル信号処理シンポジウム  2001
  • ギター演奏支援のためのタブ譜作成自動化に関する研究  [Not invited]
    青木 直史, 青木 由直
    2000
  • ギターのタブ譜自動作成に関する一検討  [Not invited]
    青木 直史, 青木 由直, 山本 強
    情報処理北海道シンポジウム2000  2000
  • テキストスピーチの開発と音声信号処理教育  [Not invited]
    青木 直史
    2000PCカンファレンス  2000
  • 運指付き五線譜からのタブ譜自動作成  [Not invited]
    青木 直史, 青木 由直, 山本 強
    電子情報通信学会ソサイエティ大会  2000
  • 日本語テキストスピーチによる英語音声の合成  [Not invited]
    青木 直史
    電気関係学会北海道支部連合大会  2000
  • 二進ウェーブレット変換を用いた音声信号のピッチ抽出に関する一改善方法  [Not invited]
    青木 直史
    電気関係学会北海道支部連合大会  2000
  • 最短経路探索によるギタータブ譜自動作成  [Not invited]
    青木 直史
    電気関係学会北海道支部連合大会  2000
  • Embedding and extracting digital watermark using the average of DCT coefficients  [Not invited]
    Yuji Morita, Yoshinao Aoki, Naofumi Aoki, Tsuyoshi Yamamoto
    電気関係学会北海道支部連合大会  2000
  • 実音声信号を用いたハードウェアによる自動シミュレーションの検討  [Not invited]
    岡田 一秀, 青木 直史, 谷山 一彦, 加藤 光彦
    電子情報通信学会総合大会  1999
  • MELPボコーダのリアルタイム実現  [Not invited]
    青木 直史, 高谷 邦夫, 伊福部 達
    情報処理北海道シンポジウム'99  1999
  • DSP評価ボードTMS320C62を用いたMELPボコーダの実現  [Not invited]
    青木 直史
    Aoki Digital Media Academy  1999
  • MELP方式による音声の規則合成に関する一考察  [Not invited]
    青木 直史, 伊福部 達
    電子情報通信学会ソサイエティ大会  1999
  • MELP方式による音声の規則合成システムの構築  [Not invited]
    青木 直史, 伊福部 達
    電気関係学会北海道支部連合大会  1999
  • ギター演奏の支援を目的とした運指呈示システムの構築  [Not invited]
    青木 直史, 青木 由直
    電気関係学会北海道支部連合大会  1999
  • 高品質音声合成のための波形ゆらぎのモデリング  [Not invited]
    青木 直史, 伊福部 達
    インターメディアシンポジウム'98  1998
  • 音源波形のウェーブレット圧縮とフラクタル補間による波形復元  [Not invited]
    青木 直史, 伊福部 達
    日本音響学会春季研究発表会  1998
  • PARCOR音声合成における音源信号の設計に関する一考察  [Not invited]
    青木 直史, 伊福部 達
    情報処理北海道シンポジウム'98  1998
  • LPC vocoder working at 2.4 kbps  [Not invited]
    AOKI Naofumi, TAKAYA Kunio
    Telecommunications Research Laboratories (TRLabs) Technology Forum  1998
  • Fractal interpolation for the modification of pulse source signal in PARCOR synthesizer  [Not invited]
    AOKI Naofumi, IFUKUBE Tohru
    IEEE North Saskatchewan Section Annual Symposium  1998
  • PARCOR synthesizer with random fractal modification  [Not invited]
    AOKI Naofumi, IFUKUBE Tohru, TAKAYA Kunio
    The College Research Day of the Department of Engineering of the University of Saskatchewan  1998
  • 母音合成と1/fゆらぎ  [Not invited]
    青木 直史, 伊福部 達
    インターメディアシンポジウム'97  1997
  • 1/fゆらぎによる持続発声母音における波形ゆらぎのモデリング  [Not invited]
    青木 直史, 伊福部 達
    日本音響学会春季研究発表会  1997
  • 持続発声母音における波形ゆらぎに関する一考察  [Not invited]
    青木 直史, 伊福部 達
    情報処理北海道シンポジウム'97  1997
  • 合成持続発声母音の自然性改善を目的とした波形ゆらぎの生成とその知覚特性  [Not invited]
    青木 直史, 伊福部 達
    日本音響学会秋季研究発表会  1997
  • 合成母音の自然性改善のための波形ゆらぎの生成とその客観的評価  [Not invited]
    青木 直史, 伊福部 達
    電気関係学会北海道支部連合大会  1997
  • ウェーブレット分析・合成による音源信号の表現に関する一考察  [Not invited]
    青木 直史, 伊福部 達
    電気関係学会北海道支部連合大会  1997
  • 合成音声における音源信号の振幅ゆらぎの役割  [Not invited]
    青木 直史, 伊福部 達
    電子情報通信学会総合大会  1996
  • 音源信号の振幅ゆらぎによるバズ音質の改善  [Not invited]
    青木 直史, 伊福部 達
    電子情報通信学会総合大会  1996
  • 1/fピッチゆらぎによる合成音声の自然性  [Not invited]
    青木 直史, 伊福部 達
    情報処理北海道シンポジウム'96  1996
  • 持続発声母音におけるピッチゆらぎのモデリング  [Not invited]
    青木 直史
    Workshop on Speech Production'96  1996
  • 1/fゆらぎを用いたMixed Excitation音声合成方式の提案  [Not invited]
    青木 直史, 伊福部 達
    電子情報通信学会ソサイエティ大会  1996
  • 持続発声母音合成における1/fゆらぎ現象の応用  [Not invited]
    青木 直史, 伊福部 達
    日本音響学会秋季研究発表会  1996
  • 持続発声母音における1/fゆらぎ現象の解析  [Not invited]
    青木 直史, 伊福部 達
    第10回ゆらぎ現象研究会  1996
  • 音源波形ゆらぎに関する一考察  [Not invited]
    青木 直史, 伊福部 達
    電気関係学会北海道支部連合大会  1995

Association Memberships

  • コンピュータ利用教育協議会   信号処理学会   日本音響学会   電子情報通信学会   Council for Improvement of Education through Computers   Research Institute of Signal Processing, Japan   Acoustical Society of Japan   Information and Communication Engineers   The Institute of Electronics   

Works

  • ギター用演奏情報キャプチャシステムの開発
    2002 -2003
  • サイバースペースにおけるノンバーバルコミュニケーションの可能性に関する調査研究
    2002 -2003
  • インターネット電話における次世代型プロトコルの開発
    2002 -2003
  • オブジェクト指向データベースマネジメントシステムによる効果音データベース検索システムの開発
    2002 -2003
  • 高速ディジタル信号処理プロセッサによるインターネット電話端末の開発
    2002 -2003
  • Development of Musical Information Capturing System
    2002 -2003
  • Research on Humanoid Agent Communication System via Cyber Space
    2002 -2003
  • Development of Next Generation Protocol for Internet Telephony
    2002 -2003
  • Development of Object-Oriented Database Management System For Sound Effect Library
    2002 -2003
  • Development of Internet Telephony System Using High-Speed Digital Signal Processor
    2002 -2003
  • ギター演奏者の読譜能力および演奏能力の解析に基づいた高精度タブ譜作成自動化に関する研究
    2001 -2002
  • Research on Automated Guitar Tablatures Generation Using Genetic Algorithm
    2001 -2002
  • ISDN環境におけるリアルタイム音声通信システムの開発
    2000
  • Development of Real-Time Speech Communication System via ISDN
    2000
  • 高速ディジタル信号処理プロセッサによるリアルタイム音声圧縮符号化システムの開発
    1999
  • Development of Real-Time Speech Codec System Using High-Speed Digital Signal Processor
    1999

Research Projects

  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2020/07 -2023/03 
    Author : 伊東 乾, 田中 有紀, 呉本 尭, 陳 捷, 石原 茂和, 青木 直史
     
    本研究は東アジア術数学とそれに基礎づけられた東アジア音楽の調和構造をデータ駆動科学を活用して明らかにすると共に、新知見をもとに調和の解析や新たなシステム創成に洋の東西を止揚した成果を生み出そうとする挑戦的研究である。 第二年次は調査、理論、解析、実証、システム開発、共生倫理検討の各面でいずれも予想を超える成果が得られた。これらを連立し更なる研究の深化、具体化と後継プロジェクトへの大胆な展開を企図してゆきたい。 2019年度に立案された本研究プロジェクトは、2020年度の開始当初、新型コロナウイルス感染症の世界的蔓延のため、国際共同研究の推進をセキュアかつソーシャルなものとする予想外のスタートを切らざるを得なかった。だが、日韓中3か国を結ぶ旅費の執行が困難になった分、セキュアかつソーシャルなシステム開発という新たな課題に挑戦することとし、被検者測定のための測定デバイスとして、永年の共同研究者・白川英樹筑波大学名誉教授(2000年ノーベル化学賞受賞)のご指導のもと、ウイルスフリーな測定環境を実現するピエゾ聴覚アクチュエータの開発に取り組んだところ、研究開始直後に2次元電子系の量子化ステップ電流の発見(LEE&ITO)という予想外の成果を得る事が出来た。 第二年次はこうしたデバイスも活用しつつ、本来の機械学習・データ駆動科学を活用した東アジア術数学のテキストベースならびに東アジア音楽調和の解析、東アジア主要大学を結ぶ術数学ネットワークの構築と原資料目録の作成・デジタイズ、先行研究で死角となっていた課題の発見と理論実験双方からのメカニズム解明、研究法自体の刷新に取り組み、さいわい各々で顕著な結果を得る事が出来た。特にデータ解析強化のため北海道大学の青木直史助教がメンバーに加わった。グループ全体で論文19報、学会登壇22件の成果が得られ、シンポジウムも開催した。具体的成果は次項に記す。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2020/04 -2023/03 
    Author : 竹内 京子, 青木 直史, 荒井 隆行, 世木 秀明, 安 啓一
     
    本研究は、言語聴覚士養成校で必修科目であるにもかかわらず、学生が苦手意識が非常に強い「音響学」(聴覚心理学を含む)の授業をどのように改善していくか、そのための現状調査、カリキュラム、教材作成、教師間連携作りを目的としている。 本年度も新型コロナウィルスの影響で、初年度に予定していた全国の言語聴覚士養成校の教員に対するアンケートの実施を延期せざるを得なかった。しかしながら、昨年度末に開始した「STのための音響学」という講習会を第10回までオンライン開催し、全国から沢山の言語聴覚士の方々に参加していただいた。開催にあたり、日本音響学会音響教育委員会、日本音声学会、東京都言語聴覚士会という関連学会、協会からの後援をいただけたのも、社会におけるネットワーク作りを目的とする本研究にとって、大きな収穫であった。 講習会のアンケートで、実際の臨床における音響学、聴覚心理学の応用の現状調査も同時に行なった。その結果、「音響学」「聴覚心理学」で学習したことは、臨床では、ほとんど活用されていない、養成校の授業と臨床との関係もあまり感じられていないなど、当初は想像していなかった問題点が浮かび上がって来た。 これらは、この講習会で現役言語聴覚士との交流があったからこそ得られた貴重な本音である。言語聴覚士養成校の授業は、学校の中では完結しない。卒後の臨床に生かされてこそである。この講習会は何が本当に必要なのか、どのように応用できるのかを共に考えるきっかけの場を作った。また、授業は教材や教授法の改善以前に大切なものがあるということを考えさせられた。 さらに、本年度は、音響学教師が授業の悩みや教授法などの相談などができる「教師間のつながりの場」をSNSを活用して作った。今後は、参加者を増やし、教師間連携、教授法の研究を進めるとともに、その結果を実際の授業にフィードバックしていくという流れを作っていきたい。
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2018/04 -2023/03 
    Author : 小嶋 徹也, 鵜木 祐史, 松元 隆博, 田中 晶, 姜 玄浩, 青木 直史, 松崎 頼人
     
    前年度に引き続き,映像や音楽の一要素を秘密のメッセージで構成して情報伝送を実現するため,音楽や映像の構成要素となり得る情報の新しい埋め込み方式を検討した。令和3年度は令和2年度に引き続き,動画データにおけるフレーム間の差分を利用してメッセージを埋め込む方式の検討を行なった。新たにフレーム間距離という概念を定義し,これを活用して埋め込まれた情報の抽出誤りを低減させる方式を開発した。 一方,音楽への情報埋め込み方式としては令和2年度に引き続き,残響音からなるリバーブ効果を活用する方式について検討した。エコーハイディング法という方式を導入することにより,リバーブとして違和感がなく,かつ情報抽出精度も高い方式を実現することができた。この方式では,スピーカから音楽を放送しスマートフォンなどで受信する,いわゆる空間音響伝送でも高い精度を実現することができたため,映像と合わせて実用の可能性が極めて高いと考えられる。さらに,これまでに開発した音楽のコード進行,リズム,ギターの歪み効果などを同時に活用することで情報の多重化を行なって送受信する方式についても検討を行なった。 以上により,本研究における技術開発は一定の目処が立ったが,主観評価などの特性検証や,実用化に向けたスマートフォンやタブレットで動作する受信用アプリの開発を進める必要もあることから,1年の研究計画の延長を決定した。 研究成果については,学会等で発表したほか,論文誌への投稿を行なった。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2016/04 -2020/03 
    Author : Aoki Naofumi
     
    With the development of information communications technique, information hiding technique has attracted much attention. It is employed as one of the information security techniques that intend to authenticate information communications technology. Applying the information hiding technique, this study has aimed to realize the concept of high value-added media communications. As a result, this study has proposed some applications of the information hiding technique as well as improved the information hiding technique itself. These results contribute the progress of information communications technique as well as information hiding technique.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2014/04 -2017/03 
    Author : ITO Ken
     
    Through the comparative study of dynamical music acoustics of churches, temples and opera houses in Japan and Europe, we had revealed fundamental characteristics of those performing spaces in relation to rituals and performances. As there is no previous research of musical acoustics in vertical variety, we have built physical mathematical models for the measurement on the basis of correlation function analysis.By use of those new methods we have analyzed dynamical characteristics of Bayreuther Festspielhous in Bayern, Germany built by the composer R. Wagner, performing Wagner’s Musikdrama in the festspielhouse. With this we have systemized the conducting technique of space-time performance for the first time on the basis of Boulez-Ito Angular Dynamic Method and published it.Applying new mathematical methods we have also revealed musical-acoustic characteristic dynamics of ancient Greek “harmonia” on the basis of Heterodyne resonance.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2012/04 -2016/03 
    Author : Aoki Naofumi
     
    With the development of information communications technique, information hiding technique has attracted much attention. It is employed as one of the information security techniques that intend to authenticate information communications technology. Applying the information hiding technique, this study has aimed to realize the concept of high value-added media communications. As a result, this study has proposed some applications of the information hiding technique as well as improved the information hiding technique itself. These results contribute the progress of information communications technique as well as information hiding technique.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2009 -2011 
    Author : AOKI Naofumi
     
    An information hiding technique called steganography can be employed for secretly transmitting side information without increasing its data size. This idea can be applied to enhancing the quality of speech communications using sub-channel data transmission based on information hiding techniques. The experimental results of this study indicate that the proposed techniques outperform the conventional ones.
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2006 -2009 
    Author : AOKI Naofumi
     
    IP 電話は,本来リアルタイム通信に不向きなベストエフォート型のIP ネットワークにより音声通信を実現しているため,パケットの欠落が原理的に不可避であり,こうした通信上のエラーが音声波形の正確な伝送を妨げ,通話品質を低下させるという問題を抱えている. 本研究では,こうした問題に対処するため,情報埋め込み技術を応用した音声データの修復法を考案し,従来よりも優れた通話品質を提供する手法を見出した.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2002 -2004 
    Author : 青木 由直, 青木 直史, 姜 錫, 三橋 龍一
     
    コンピュータグラフィックス(CG)技法において、3次元モデルを2次元の画面に表示する原理により、2次元と3次元の中間に位置する2.X次元のアートと呼べる、新しいマルチメディア・アート技法を開発した。開発技法で実際に2.X次元アートの作品を制作してみて、評価と考察を行った。開発技法は従来TIP(Tour Into the Picture)と呼ばれているCG技法を参考にしており、1枚の手書きスケッチから擬似3次元画像を制作して表示する技法の開発を進めた。この技法では、絵の中に描き込まれた対象物や景観を切り出して、これに距離情報を付加したキャンバスに貼り付け、絵のモデルの再構成を行う必要がある。従来の方法ではこれを手作業で行っていて、利用上で手間のかかるもので、新しいアートのツールとして定着させるには難点があった。この点を改良して、対象物の切り出しと切り出した画面の抜け跡を背景で埋める作業を半自動化する技法を開発した。その際、表示画面上での切り出し作業や穴埋め作業をペン型のマウス(タブレットPC)で行えるようにして、利用者に使い易いシステムを開発した。視点や視線方向の設定、目の動きの設定、等も画面上のメニューから選べるようにしており、一般の利用者でも容易に使えるようなシステムとして完成させた。このシステム構築に際して、手描きの絵から遠近情報を取り出す方法の考察、アニメーション表示に際しての芸術性,元の2次元絵画とそのアニメーション化による絵画の印象の差異等について考察を行った。将来、この種のアート拡大を検討するため、札幌市内の画廊を借りて、元のスケッチ画とそれから制作した2.X次元画像としてのアニメーションをPCで表示する展示会を催し、見学者から評価を集めた。開発した技法に興味を持った一般の人がかなり居り、新聞記事としても取り上げられて、今後このようなアートの普及に際しての知見を得た。
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 2001 -2003 
    Author : AOKI Yoshinao, HASAYAMA Miki, ARAKI Kenji, YAMAMOTO Tsuyoshi, YAMAGATA Sekiji, AOKI Naofumi, SAKAMOTO Yuji, KANG Seok
     
    The research results are listed as follows ; (1) We discussed an 'avatar language communication' in relation to communication across the linguistic barrier, where we developed a non-verbal communication with gestures and emotional expressions of avatars displayed using CG (computer graphics) animations. (2) We developed an avatar language chatting system supposing an international communication using avatar language between Japan and Korea and an experimental discussion was done, resulting in the possibility of an avatar chatting system across the linguistic barrier. (3) We developed an avatar communication system using smiley marks (Kao-moji in Japanese), where emotional expression is input by symbols on the keyboard and the developed face-creation editor produces emotional expression of the comic face. The advantage of the comic expression of face is shown by an experiment of communication with emotion, where a new concept of CAU (Comic Action Unit) is proposed to create comic CG faces. (4) We proposed the technique to communicated in the circumstances of ubiquitous computer and communication with a special interface system to input gesture of communicator developed in this research. (5) A discussion on the application of avatar language to the WBT (Web Based Training) in order to apply the avatar language communication to the e-learning. (6) As an application of avatar language communication system, a service on the mobile phone is proposed and the potentiality of this application is demonstrated by constructing a mobile phone system in a PC.
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 2001 -2002 
    Author : 青木 直史
     
    平成14年度は,平成13年度に引き続き,インターネットを介した音声処理システムの可能性について調査および具体的な実装を通じて研究を展開した.特にマルチリンガル対応の音声合成システムの構築を念頭において研究を行った.国外における同様の研究課題に関する調査として,フィンランド・ヘルシンキ工科大学における研究動向の実地調査を行った.マルチリンガル対応の音声合成システムの構築には,必要となる言語の音声データベースを準備する必要があるが,本研究では,これまでに各国の研究機関で構築された音声データベースを再利用する枠組みを新たに提案し,XML (eXtensible Markup Language)に基づくデータ交換のための標準フォーマットを提案した.また,こうした標準フォーマットにより実際に音声データベースを整備し,これをインターネット上に公開することで,ボーダレスかつシームレスに音声データベースを利用する音声合成システムの実装を行った. 上記の研究課題と並行して,インターネットのブロードバンド化が進み,リアルタイム通信が実用段階に入りつつある背景を鑑み,インターネットを介した音声処理システムの一つであり,次世代の電話サービスとして急速に利用が進みつつあるVoIP (Voice over IP)に関する調査を行った.VoIPはベストエフォート型の通信方式によってリアルタイム通信を行うため,パケットの遅延や損失といったエラーに対してリアルタイムに対処する必要があるが,本研究では,こうした問題に対して,暗号技術のひとつであるステガノグラフィ技術を適用することで,伝送量を増加させることなく,従来法よりも有効に音質改善を行える可能性があることを実証するに至った.また,情報隠蔽技術の高度化を目標として,様々な角度からステガノグラフィ技術の高度化について検討した.
  • 楽器演奏情報キャプチャシステムの開発
    共同研究
    Date (from‐to) : 2002
  • 顔画像認識に基づくバイオメトリクス技術の高度化に関する研究
    共同研究
    Date (from‐to) : 2002
  • ステガノグラフィを利用したインターネット電話のパケット損失エラー隠蔽に関する研究
    共同研究
    Date (from‐to) : 2002
  • 高速ディジタル信号処理プロセッサによるインターネット電話端末の開発
    共同研究
    Date (from‐to) : 2002
  • Development of Musical Information Capturing System
    Cooperative Research
    Date (from‐to) : 2002
  • Research on Biometrics Technique Based on Facial Recognition
    Cooperative Research
    Date (from‐to) : 2002
  • Research on Packet Error Hiding Technique for Internet Telephony Using Steganography
    Cooperative Research
    Date (from‐to) : 2002
  • Development of Internet Telephony System Using High-Speed Digital Signal Processor
    Cooperative Research
    Date (from‐to) : 2002
  • Japan Society for the Promotion of Science:Grants-in-Aid for Scientific Research
    Date (from‐to) : 1998 -2000 
    Author : AOKI Yoshinao, TANAHASHI Shin, SAKAMOTO Yuji, YAMAMOTO Tsuyoshi, HATSUDA Takeshi, FUJIWARA Yoshitaka, MITSUHASHI Ryuichi,takeshi, AOKI Naofumi, KAWASHIMA Toshio
     
    The research results are listed as follows ; (1) We proposed a new concept of 'avatar language' in relation to avatar technique in the Internet to realize a non-verbal communication, where gestures and emotional expressions of avatars are displayed using CG (computer graphics) animations. (2) We developed a new programming language Lifo, which is a descendant of Lisp and Forth language to achieve high-speed processing in producing and displaying CG animations of avatar language. (3) We developed a CG system for generating CG animations corresponding to words from avatar language in order to communicate across the linguistic barrier. A server-client system is developed for avatar-language communication using the developed CG system. (4) We constructed an avatar-language chatting system using a software tool : MATLAB, where the system is constructed without complicated computer programming, resulting in simple chatting system. (5) An experiment was conducted between avatars in Japanese and Korean environments to communicate using avatar language, resulting in collecting a basic data to develop a practical system of a non-verbal communication using avatar language in future. (6) A communication experiment using Japanese communication satellite JCSAT was conducted to confirm the validity of the developed avatar-language chatting system. (7) We proposed the virtual execution environment control system in order to apply to the avatar language communication via communication satellites, where responsiveness for the remote access was improved. (8) We proposed a new estimation technique of urban shielding and satellite diversity characteristics for mobile broadcast geo-stationary satellite to obtain data for the practical use of communication satellite for avatar communication in future.
  • 脆弱型電子透かしを利用したディジタルコンテンツの原本性保証に関する研究
    共同研究
    Date (from‐to) : 2000
  • ネットワーク利用型オブジェクト指向データベースマネジメントシステムの応用に関する研究
    共同研究
    Date (from‐to) : 2000
  • 音声合成システムのオープンソース化に関する研究
    共同研究
    Date (from‐to) : 2000
  • Research on Securing Digital Contents Based on Fragile Watermarking
    Cooperative Research
    Date (from‐to) : 2000
  • Research on Object-Oriented Database Management System Utilizing Network
    Cooperative Research
    Date (from‐to) : 2000
  • Research on Open-Sourcing of Speech Synthesis System
    Cooperative Research
    Date (from‐to) : 2000
  • 日本学術振興会:科学研究費助成事業
    Date (from‐to) : 1999 -1999 
    Author : 青木 直史
  • サイバースペースを利用した擬人化エージェント通信に関する研究
    共同研究
    Date (from‐to) : 1999
  • Research on Humanoid Agent Communication System via Cyber Space
    Cooperative Research
    Date (from‐to) : 1999
  • 非線形音声分析に基づく音声合成の高品質化に関する研究
    その他の研究制度
    Date (from‐to) : 1995
  • Research on High-Quality Speech Synthesis System Based on Nonlinear Speech Analysis
    The Other Research Programs
    Date (from‐to) : 1995
  • オブジェクト指向データベースマネジメントシステムによるバイオインフォマティクス研究支援システムの開発
  • ギター用演奏情報キャプチャシステムの開発
  • ステガノグラフィによる情報隠蔽技術の高度化とそれを利用した高付加価値情報通信システムの開発
  • 音声合成システムのオープンソース化に関する研究開発
  • Research on Bioinformatics Utilizing Object-Oriented Database Management System
  • Development of Musical Information Capturing System
  • Research on Packet Error Hiding Technique for Internet Telephony Using Steganography
  • Research on Open-Sourcing of Speech Synthesis System

Industrial Property Rights

  • 音素セグメンテーション方法及び装置
    2005-104513
  • 実視界・空間座標同期システム
    2005-041196
  • 鳴子
    2004-159709
  • 弦楽器の演奏動作キャプチャリング装置,運指解析装置,演奏動作キャプチャリング用弦楽器及び運指練習用弦楽器
    2004-045250
  • VoIP音声通信におけるパケット損失隠蔽方法,装置およびプログラム
    2003-341918
  • VoIP音声通信方法,システム,その送信端末と受信端末およびプログラム
    2003-342298
  • ポインティングデバイス
    2003-68865
  • 改ざん検出方法、改ざん検出プログラム及びそのプログラムを記録した記録媒体
    2002-315391
  • タブ譜自動作成方法,タブ譜自動作成プログラム及びそのプログラムを記録した記録媒体
    2002-286166
  • 改ざん位置検出方法,改ざん位置検出プログラム及びそのプログラムを記録した記録媒体
    2002-201703
  • エラー隠蔽方法,エラー隠蔽プログラム及びエラー隠蔽装置
    2002-117829


Copyright © MEDIA FUSION Co.,Ltd. All rights reserved.