長谷山 美紀 (ハセヤマ ミキ)

情報科学研究院 メディアネットワーク部門 情報メディア学分野教授
総合イノベーション創発機構データ駆動型融合研究創発拠点教授
Last Updated :2025/05/02

■研究者基本情報

学位

  • 博士(工学), 北海道大学

Researchmap個人ページ

研究キーワード

  • 画像生成
  • 行動解析
  • マルチスペクトル解析
  • 機械学習
  • 深層学習
  • CT
  • PET
  • X線画像
  • SNS
  • 電子顕微鏡
  • 画像認識
  • 画像復元
  • Webマイニング
  • 超解像
  • 画像符号化
  • 医用画像
  • 衛星画像
  • 社会基盤
  • マルチメディア処理
  • EEG
  • NIRS
  • MRI
  • 可視化
  • ビッグデータ
  • IoT
  • 人工知能
  • 情報検索
  • 遺伝的アルゴリズム
  • テクスチャ
  • 雑音除去
  • ディジタル フィルタ
  • ファジー推論
  • スポーツ映像
  • ウェーブレット
  • 音楽
  • 量子化
  • モデル同定
  • 意味理解
  • テキスト処理
  • 画像処理
  • 信号処理
  • 画像検索

研究分野

  • 情報通信, 知能情報学
  • 情報通信, 知能ロボティクス
  • ライフサイエンス, 基礎看護学
  • 情報通信, ウェブ情報学、サービス情報学
  • 情報通信, 感性情報学
  • 情報通信, ヒューマンインタフェース、インタラクション
  • 情報通信, データベース
  • ものづくり技術(機械・電気電子・化学工学), 計測工学
  • ものづくり技術(機械・電気電子・化学工学), 制御、システム工学

担当教育組織

■経歴

経歴

  • 2022年07月 - 現在
    北海道大学, 創成研究機構データ駆動型融合研究創発拠点(D-RED), 拠点長
  • 2020年10月 - 現在
    北海道大学, 副学長
  • 2020年04月 - 現在
    北海道大学 大学院情報科学研究院 研究院長
  • 2020年04月 - 現在
    北海道大学 大学院情報科学研究院 学院長
  • 2006年04月 - 現在
    北海道大学, 大学院情報科学研究科, 教授
  • 2022年04月 - 2023年03月
    北海道大学, 数理・データサイエンス教育研究センター, センター長
  • 2017年07月 - 2021年03月
    北海道大学, 数理・データサイエンス教育研究センター, センター長
  • 2018年04月 - 2020年03月
    北海道大学 大学院情報科学研究科 副研究院長, Graduate School of Information Science and Technology
  • 2017年04月 - 2020年03月
    北海道大学 総合IR室副室長
  • 2013年04月 - 2020年03月
    北海道大学 総長補佐
  • 2017年04月 - 2019年03月
    北海道大学 人材育成本部 女性研究者支援室室長, Front Office for Human Resource Education and Development
  • 2004年04月 - 2006年03月
    北海道大学, 大学院情報科学研究科, 助教授
  • 1997年04月 - 2004年03月
    北海道大学, 大学院工学研究科, 助教授
  • 1994年01月 - 1997年03月
    北海道大学, 工学部, 助教授
  • 1989年08月 - 1993年12月
    北海道大学, 電子科学研究所, 助手

学歴

  • 1986年04月 - 1988年03月, 北海道大学, 大学院工学研究科, 電子工学専攻, 修士課程
  • 1982年04月 - 1986年03月, 北海道大学, 工学部

委員歴

  • 2023年04月 - 現在
    国立研究開発法人科学技術振興機構(JST) 分野別委員会<AI・情報分野>, 委員
  • 2023年03月 - 現在
    経済産業省 北海道デジタル人材育成推進協議会, 委員
  • 2021年10月 - 現在
    内閣府 総合科学技術・イノベーション会議「評価専門調査会」, 専門委員
  • 2021年07月 - 現在
    国立研究開発法人科学技術振興機構(JST) 次世代研究者挑戦的研究プログラム委員会, 委員
  • 2021年06月 - 現在
    一般財団法人VCCI協会, 評議員
  • 2020年06月 - 現在
    公益財団法人 KDDI財団, 理事
  • 2020年04月 - 現在
    国立研究開発法人科学技術振興機構(JST) 創発的研究支援事業運営委員会, 委員
  • 2020年04月 - 現在
    文部科学省 国立研究開発法人審議会, 臨時委員
  • 2019年01月 - 現在
    総務省 情報通信審議会(情報通信技術分科会、電波利用環境委員会), 委員
  • 2019年01月 - 現在
    内閣府 総合科学技術・イノベーション会議, シニアフェロー, 政府
  • 2015年07月 - 現在
    北海道経済部産業振興局科学技術振興室, 北海道科学技術審議会 委員, 自治体
  • 2015年03月 - 現在
    文部科学省, 科学技術・学術審議会 臨時委員, 政府
  • 2015年01月 - 現在
    国土交通省, 国土審議会 専門委員(北海道開発分科会), 政府
  • 2013年 - 現在
    電子情報通信学会, 専門委員, 学協会
  • 2011年 - 現在
    日本学術会議, 連携会員, 学協会
  • 2022年07月 - 2023年05月
    内閣府 次期SIPの課題候補「ポストコロナ時代の学び方・働き方を実現するプラットフォームの構築」のFS実施におけるTF, 構成員
  • 2019年04月 - 2023年03月
    文部科学省 数理・データサイエンス・AI教育プログラム認定制度審査委員会, 委員
  • 2022年10月
    国立研究開発法人科学技術振興機構(JST) 研究開発戦略センター分野別委員会, 委員
  • 2015年08月 - 2017年03月
    国立研究開発法人 科学技術振興機構, 技術シーズ選抜育成プロジェクト〔ロボティクス分野〕 アドバイザー, 政府
  • 2015年04月 - 2017年02月
    文部科学省, 科学技術・学術審議会 戦略的基礎研究部会 数学イノベーション委員会臨時委員, 政府
  • 2008年 - 2016年03月
    日本放送協会, 放送技術審議会委員, その他
  • 2013年 - 2015年05月
    電子情報通信学会, 調査理事, 学協会
  • 2013年 - 2014年05月
    映像情報メディア学会 北海道支部, 支部長, 学協会
  • 2011年 - 2013年05月
    映像情報メディア学会, 副会長, 学協会
  • 2007年 - 2009年
    映像情報メディア学会, 映像情報メディア学会誌編集委員会論文部門委員, 学協会
  • 2007年 - 2009年
    映像情報メディア学会, メディア工学研究委員会幹事, 学協会

学内役職歴

  • 企画・経営室室員, 2017年4月1日 - 2017年10月25日
  • 教育研究評議会評議員, 2020年4月1日 - 2022年3月31日
  • 教育研究評議会評議員, 2022年4月1日 - 2024年3月31日
  • 経営戦略室室員, 2017年10月26日 - 2019年3月31日
  • 経営戦略室室員, 2019年4月1日 - 2020年3月31日
  • 研究戦略室室員, 2013年4月1日 - 2017年3月31日
  • 数理・データサイエンス教育研究センター長, 2017年7月1日 - 2019年3月31日
  • 数理・データサイエンス教育研究センター長, 2019年4月1日 - 2021年3月31日
  • 数理・データサイエンス教育研究センター長, 2022年4月1日 - 2023年3月31日
  • 創成研究機構データ駆動型融合研究創発拠点長, 2022年7月1日 - 2024年12月31日
  • 総合IR室長, 2022年4月1日 - 2023年3月31日
  • 総合IR本部長, 2023年4月1日 - 2024年3月31日
  • 総合IR本部長, 2024年4月1日 - 2026年3月31日
  • 総合イノベーション創発機構データ駆動型融合研究創発拠点長, 2025年1月1日 - 2026年3月31日
  • 総長補佐, 2014年4月1日 - 2015年3月31日
  • 総長補佐, 2015年4月1日 - 2017年3月31日
  • 総長補佐, 2017年4月1日 - 2019年3月31日
  • 総長補佐, 2019年4月1日 - 2020年3月31日
  • 大学院情報科学院長, 2020年4月1日 - 2022年3月31日
  • 大学院情報科学院長, 2022年4月1日 - 2024年3月31日
  • 大学院情報科学研究院長, 2020年4月1日 - 2022年3月31日
  • 大学院情報科学研究院長, 2022年4月1日 - 2024年3月31日
  • 大学院情報科学研究院副研究院長, 2019年4月1日 - 2020年3月31日
  • 大学院情報科学研究科副研究科長, 2018年4月1日 - 2019年3月31日
  • 副学長, 2020年10月1日 - 2022年3月31日
  • 副学長, 2022年4月1日 - 2024年3月31日
  • 副学長, 2024年4月1日 - 2026年3月31日
  • 副工学部長, 2020年4月1日 - 2022年3月31日
  • 副工学部長, 2022年4月1日 - 2024年3月31日
  • 役員補佐, 2013年4月1日 - 2014年3月31日

■研究活動情報

受賞

  • 2023年10月, Bronze Prize GCCE2023 Excellent Student Poster Award               
    Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
  • 2023年10月, Silver Prize GCCE2023 Excellent Paper Award               
    Haruka Matsuda, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
  • 2023年07月, Best Paper Award Honorable Mention               
    Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
  • 2023年01月, The 2022 IEEE Sapporo Section Encouragement Award               
    Nao Nakagawa;Ren Togo;Takahiro Ogawa;Miki Haseyama
  • 2023年01月, The 2022 IEEE Sapporo Section Encouragement Award               
    Naoki Ogawa;Keisuke Maeda;Takahiro Ogawa;Miki Haseyama
  • 2023年01月, The 2022 IEEE Sapporo Section Encouragement Award               
    Kyohei Kamikawa;Keisuke Maeda;Takahiro Ogawa;Miki Haseyama
  • 2023年01月, Best Paper Award               
    Teruhisa Yamashiro;Yuki Honma;Ren Togo;Takahiro Ogawa;Miki Haseyama;International;Workshop on;Advanced Image Technology;IWAIT
  • 2022年12月, 優秀研究発表賞               
    ユーザの嗜好を考慮した強化学習と知識グラフに基づく楽曲プレイリスト生成に関する検討, 映像情報メディア学会技術報告, vol.46, no.6, pp.109-112
    櫻井 慶悟, 藤後 廉, 小川 貴弘, 長谷山 美紀
  • 2022年12月, 若手優秀論文発表賞               
    五箇 亮太;諸戸 祐哉;前田 圭介;小川 貴弘;長谷山 美紀
  • 2022年12月, 若手優秀論文発表賞               
    七田 亮, 藤後 廉, 前田 圭介, 小川 貴弘, 長谷山 美紀
  • 2022年12月, 若手優秀論文発表賞               
    山本一輝;前田 圭介;藤後 廉;小川 貴弘;長谷山 美紀
  • 2022年11月, Bronze Prize GCCE2022 Excellent Student Paper Award               
    Cross-platform recommendation considering common users’ preferences based on preference propagation graphnet, 2022 IEEE 11th Global Conference on Consumer Electronics (GCCE 2022), pp.133-134
    Kazuki Yamamoto;Keisuke Maeda;Ren Togo;Takahiro Ogawa;Miki Haseyama
  • 2022年11月, 第1回 北海道大学医療AIシンポジウム 優秀研究賞               
    李 広;藤後 廉;小川 貴弘;長谷山 美紀
  • 2022年10月, Silver Prize GCCE2022 Excellent Poster Award               
    Free-viewpoint sports video generation based on dynamic NeRF considering time series, 2022 IEEE 11th Global Conference on Consumer Electronics (GCCE 2022), pp.419-420
    Masato Kawai;Rintaro Yanagi;Togo Ren;Takahiro Ogawa;Miki Haseyama
  • 2022年10月, Silver Prize GCCE2022 Excellent Student Poster Award               
    Content-based image retrieval using effective synthesized images from different camera views via pixelNeRF, 2022 IEEE 11th Global Conference on Consumer Electronics (GCCE 2022), pp.415-416
    Yuki Era;Ren Togo;Keisuke Maeda;Takahiro Ogawa;Miki Haseyama
  • 2022年09月, 土木学会 土木情報学システム開発賞               
  • 2022年08月, MIRU 2022 学生奨励賞2件               
  • 2022年03月, IEEE LifeTech 2022 WIE Excellent Poster Award               
  • 2022年02月, 2021 IEEE Sapporo Section Student Paper Contest, Best Presentation Award               
  • 2022年02月, 2021 IEEE Sapporo Section Encouragement Award 2件               
  • 2022年01月, International Workshop on Advanced Image Technology (IWAIT2022) Best Paper Award               
  • 2021年12月, 映像情報メディア学会 優秀研究発表賞               
  • 2021年12月, 令和3年度電気・情報関係学会北海道支部連合大会 若手優秀論文発表賞 3件               
  • 2021年10月, The 1st Hokkaido Young Professionals Workshop Best Student Presentation Award               
  • 2021年10月, 2021 IEEE 10th Global Conference on Consumer Electronics, Gold Prize GCCE2021 Excellent Poster Award               
  • 2021年10月, 2021 IEEE 10th Global Conference on Consumer Electronics, Gold Prize GCCE2021 Excellent Student Poster Award               
  • 2021年10月, 2021 IEEE 10th Global Conference on Consumer Electronics, Silver Prize GCCE2021 Excellent Student Poster Award               
  • 2021年10月, 2021 IEEE 10th Global Conference on Consumer Electronics, GCCE2021 Outstanding Paper Award               
  • 2021年06月, 映像情報メディア学会丹羽高柳賞論文賞               
  • 2021年03月, ACM Multimedia Asia 2020, Best Paper Runner-up Award               
  • 2021年03月, 2021 IEEE 3rd Global Conference on Life Sciences and Technologies, Excellent Poster (On-site) Award Winners: Bronze Prize               
  • 2021年03月, IEEE LifeTech 2021 Excellent Student Paper Award for Oral Presentation, 2nd Prize               
  • 2021年02月, 2020 IEEE Sapporo Section Student Paper Awards, Encouragement Paper Award               
  • 2021年02月, 2020 IEEE Sapporo Section Student Paper Awards, Best Paper Award               
  • 2020年11月, 令和2年度電気・情報関係学会北海道支部連合大会 若手優秀論文発表賞 3件               
  • 2020年10月, 2020 IEEE 9th Global Conference on Consumer Electronics, Bronze Prize GCCE2020 Excellent Paper Award               
  • 2020年10月, 2020 IEEE 9th Global Conference on Consumer Electronics, Silver Prize IEEE GCCE2020 Excellent Paper Award               
  • 2020年10月, 2020 IEEE 9th Global Conference on Consumer Electronics, Gold Prize IEEE GCCE2020 Excellent Demo! Award               
  • 2020年10月, 2020 IEEE 9th Global Conference on Consumer Electronics, Gold Prize GCCE2020 Excellent Poster Award               
  • 2020年10月, 2020 IEEE 9th Global Conference on Consumer Electronics, Gold Prize IEEE GCCE2020 Excellent Student Paper Award               
  • 2020年06月, 映像情報メディア学会丹羽高柳賞論文賞               
  • 2020年05月, 2020 ICCE-TW Best Paper Award Honorable Metion               
  • 2020年02月, The 2019 IEEE Sapporo Section Student Paper Contest Encouraging Prize 3件               
  • 2020年02月, The 2019 IEEE Sapporo Section Encouragement Award               
  • 2019年12月, 映像情報メディア学会 優秀研究発表賞               
  • 2019年12月, 令和元年度電気・情報関係学会北海道支部連合大会 若手優秀論文発表賞 2件               
  • 2019年10月, 2019 IEEE 8th Global Conference on Consumer Electronics, Silver Prize IEEE GCCE 2019 Excelent Paper Award               
  • 2019年10月, 2019 IEEE 8th Global Conference on Consumer Electronics, Silver Prize IEEE GCCE 2019 Excelent Poster Award               
  • 2019年10月, 2019 IEEE 8th Global Conference on Consumer Electronics, Outstanding Prize IEEE GCCE 2019 Excelent Demo! Award               
  • 2019年03月, 2019 IEEE 1st Global Conference on Life Sciences and Technologies, 2nd Prize IEEE Lifetech 2019 Excellent Paper Award               
  • 2019年02月, The 2018 IEEE Sapporo Section Student Paper Contest Encouraging Prize               
  • 2019年02月, The 2018 IEEE Sapporo Section Encouragement Award 2件               
  • 2019年01月, The 2019 joint International Workshop on Advanced Image Technology & International Forum on Medical Imaging in Asia IWAIT Best Paper Award               
  • 2018年12月, 平成30年度電気・情報関係学会北海道支部連合大会 優秀論文発表賞               
  • 2018年12月, 映像情報メディア学会 優秀研究発表賞               
  • 2018年10月, 2018 IEEE 7th Global Conference on Consumer Electronics, IEEE GCCE 2018 Outstanding Paper Award               
  • 2018年10月, 2018 IEEE 7th Global Conference on Consumer Electronics, 1st Prize IEEE GCCE 2018 Excellent Poster Award               
  • 2018年, 平成29年度電気・情報関係学会北海道支部連合大会 優秀論文発表賞               
  • 2018年, The 2017 IEEE Sapporo Section Student Paper Contest Encouraging Prize               
  • 2018年, The 2017 IEEE Sapporo Section Encouragement Award (2件)               
  • 2017年, International Workshop on Advanced Image Technology (IWAIT2017) Best Paper Award               
  • 2017年, 平成28年度電気・情報関係学会北海道支部連合大会 優秀論文発表賞               
  • 2017年, The 2016 IEEE Sapporo Section Student Paper Contest Encouraging Prize               
  • 2017年, The 2016 IEEE Sapporo Section Encouragement Award               
  • 2017年, 電子情報通信学会 学術奨励賞               
  • 2017年, 精密工学会画像応用技術専門委員会・映像情報メディア学会メディア工学研究委員会合同サマーセミナー 優秀発表賞               
  • 2017年, 2017 IEEE 6th Global Conference on Consumer Electronics, IEEE GCCE 2017 Outstanding Poster Award               
  • 2016年, 2016 IEEE 5th Global Conference on Consumer Electronics 1st Prize IEEE GCCE 2016 Excellent Poster Award               
  • 2016年, 平成27年度電気・情報関係学会北海道支部連合大会 優秀論文発表賞 (2件)               
  • 2016年, The 2015 IEEE Sapporo Section Student Paper Contest Encouraging Prize               
  • 2016年, The 2015 IEEE Sapporo Section Encouragement Award (2件)               
  • 2015年05月, 映像情報メディア学会, 丹羽高柳賞               
    業績賞
    長谷山 美紀
  • 2015年, International Workshop on Advanced Image Technology (IWAIT2015) Best Paper Award               
  • 2015年, IEEE GCCE 2015 Excellent Poster Award               
  • 2015年, IEEE GCCE 2015 Outstanding Poster Award               
  • 2015年, The 2014 IEEE Sapporo Section Student Paper Contest Best Presentation Award               
  • 2015年, 平成27年度 映像情報メディア学会 優秀研究発表賞               
  • 2014年06月, 総務省北海道総合通信局, 平成26年度情報通信月間 北海道総合通信局長表彰               
    長谷山 美紀
  • 2014年, IEEE GCCE 2014 Undergraduate Poster Award               
  • 2013年, 平成25年度電気・情報関係学会北海道支部連合大会 優秀論文発表賞               
  • 2011年, 平成23年度信号処理学生奨励賞 (2件)               
  • 2011年, 平成23年度電気関係学会北海道支部連合大会 若手優秀論文発表賞               
  • 2011年, 映像情報メディア学会 学生優秀発表賞               
  • 2011年, SIP学生奨励賞               
    日本国
  • 2011年, 平成23年度電気・情報関係学会北海道支部 優秀論文発表賞               
    日本国
  • 2011年, 映像情報メディア学会年次大会 学生優秀発表賞               
    日本国
  • 2010年, 平成22年度電気関係学会北海道支部連合大会 若手優秀論文発表賞               
  • 2010年, 2010 IEEE Sapporo Section Student Member Best Presentation Award               
  • 2009年, 電子情報通信学会論文賞               
  • 2009年, 平成21年度電気・情報関係学会北海道支部連合大会 優秀論文発表賞               
    日本国
  • 2009年, 平成20年度電子情報通信学会論文賞               
    日本国
  • 2008年, IEEE CE-Society 日本支部 若手論文賞               
  • 2008年, 平成20年度電気関係学会北海道支部連合大会 若手優秀論文発表賞               
  • 2008年, 2008 IEEE Sapporo Section Student Member Encouraging Prize               
  • 2007年, 平成19年度電気関係学会北海道支部連合大会 若手優秀論文発表賞               
  • 2007年, IEEE International Conference on Consumer Electronics, IEEE Consumer Electronics Society Japan Chapter Young Scientist Paper Award               
  • 2006年, 2006 IEEE Sapporo Section Student Paper Contest Award               
  • 2005年, 精密工学会画像応用技術専門委員会・映像情報メディア学会メディア工学研究委員会合同サマーセミナー優秀発表賞               
  • 2005年, 平成17年度電気情報関係学会北海道支部連合大会 若手優秀論文発表賞               
  • 2005年, 映像情報メディア学会 研究奨励賞               
  • The 2022 IEEE Sapporo Section Student Paper Contest Encouraging Prize               
    河合 雅斗;柳 凜太郎;藤後 廉;小川 貴弘;長谷山 美紀

論文

  • Manta: Enhancing Mamba for Few-Shot Action Recognition of Long Sub-Sequence
    Wenbo Huang, Jinghui Zhang, Guang Li, Lei Zhang, Shuoyuan Wang, Fang Dong, Jiahui Jin, Takahiro Ogawa, Miki Haseyama
    Proceedings of the AAAI Conference on Artificial Intelligence, 39, 4, 3751, 3759, Association for the Advancement of Artificial Intelligence (AAAI), 2025年04月11日
    研究論文(学術雑誌), In few-shot action recognition (FSAR), long sub-sequences of video naturally express entire actions more effectively. However, the high computational complexity of mainstream Transformer-based methods limits their application. Recent Mamba demonstrates efficiency in modeling long sequences, but directly applying Mamba to FSAR overlooks the importance of local feature modeling and alignment. Moreover, long sub-sequences within the same class accumulate intra-class variance, which adversely impacts FSAR performance. To solve these challenges, we propose a Matryoshka MAmba and CoNtrasTive LeArning framework (Manta). Firstly, the Matryoshka Mamba introduces multiple Inner Modules to enhance local feature representation, rather than directly modeling global features. An Outer Module captures dependencies of timeline between these local features for implicit temporal alignment. Secondly, a hybrid contrastive learning paradigm, combining both supervised and unsupervised methods, is designed to mitigate the negative effects of intra-class variance accumulation. The Matryoshka Mamba and the hybrid contrastive learning paradigm operate in two parallel branches within Manta, enhancing Mamba for FSAR of long sub-sequence. Manta achieves new state-of-the-art performance on prominent benchmarks, including SSv2, Kinetics, UCF101, and HMDB51. Extensive empirical studies prove that Manta significantly improves FSAR of long sub-sequence from multiple perspectives.
  • Generative Dataset Distillation Based on Self-knowledge Distillation
    Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 1, 5, IEEE, 2025年04月06日
    研究論文(国際会議プロシーディングス)
  • Continual Self-supervised Learning Considering Medical Domain Knowledge in Chest CT Images
    Ren Tasai, Guang Li, Ren Togo, Minghui Tang, Takaaki Yoshimura, Hiroyuki Sugimori, Kenji Hirata, Takahiro Ogawa, Kohsuke Kudo, Miki Haseyama
    ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 1, 5, IEEE, 2025年04月06日
    研究論文(国際会議プロシーディングス)
  • Multistage deep learning for classification of Helicobacter pylori infection status using endoscopic images
    Guang Li, Ren Togo, Katsuhiro Mabe, Shunpei Nishida, Yoshihiro Tomoda, Fumiyuki Shiratani, Masashi Hirota, Takahiro Ogawa, Miki Haseyama
    Journal of Gastroenterology, 60, 4, 408, 415, Springer Science and Business Media LLC, 2025年01月15日
    研究論文(学術雑誌)
  • Lung Disease Classification with Limited Training Data Based on Weight Selection Technique
    Ayaka Tsutsumi, Guang Li, Ren Togo, Takahiro Ogawa, Satoshi Kondo, Miki Haseyama
    2024 IEEE 13th Global Conference on Consumer Electronics (GCCE), 460, 461, IEEE, 2024年10月29日
    研究論文(国際会議プロシーディングス)
  • Generative Dataset Distillation Based on Large Model Pool
    Longzhen Li, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2024 IEEE 13th Global Conference on Consumer Electronics (GCCE), 458, 459, IEEE, 2024年10月29日
    研究論文(国際会議プロシーディングス)
  • Lung Cancer Classification Using Masked Autoencoder Pretrained on J-MID Database
    Ren Tasai, Guang Li, Ren Togo, Minghui Tang, Takaaki Yoshimura, Hiroyuki Sugimori, Kenji Hirata, Takahiro Ogawa, Kohsuke Kudo, Miki Haseyama
    2024 IEEE 13th Global Conference on Consumer Electronics (GCCE), 456, 457, IEEE, 2024年10月29日
    研究論文(国際会議プロシーディングス)
  • Graph Convolutional Network-based Sports Skill-level Recognition via Deep Metric Learning
    Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    2024 International Technical Conference on Circuits/Systems, Computers, and Communications (ITC-CSCC), 15, 1, 4, IEEE, 2024年07月02日
    研究論文(国際会議プロシーディングス)
  • Multimodal Transformer Model Using Time-Series Data to Classify Winter Road Surface Conditions.
    Yuya Moroto, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 24, 11, 3440, 3440, 2024年06月
    研究論文(学術雑誌)
  • Trial Analysis of Brain Activity Information for the Presymptomatic Disease Detection of Rheumatoid Arthritis.
    Keisuke Maeda, Takahiro Ogawa, Tasuku Kayama, Takuya Sasaki, Kazuki Tainaka, Masaaki Murakami, Miki Haseyama
    Bioengineering (Basel, Switzerland), 11, 6, 2024年05月21日, [国際誌]
    英語, 研究論文(学術雑誌), This study presents a trial analysis that uses brain activity information obtained from mice to detect rheumatoid arthritis (RA) in its presymptomatic stages. Specifically, we confirmed that F759 mice, serving as a mouse model of RA that is dependent on the inflammatory cytokine IL-6, and healthy wild-type mice can be classified on the basis of brain activity information. We clarified which brain regions are useful for the presymptomatic detection of RA. We introduced a matrix completion-based approach to handle missing brain activity information to perform the aforementioned analysis. In addition, we implemented a canonical correlation-based method capable of analyzing the relationship between various types of brain activity information. This method allowed us to accurately classify F759 and wild-type mice, thereby identifying essential features, including crucial brain regions, for the presymptomatic detection of RA. Our experiment obtained brain activity information from 15 F759 and 10 wild-type mice and analyzed the acquired data. By employing four types of classifiers, our experimental results show that the thalamus and periaqueductal gray are effective for the classification task. Furthermore, we confirmed that classification performance was maximized when seven brain regions were used, excluding the electromyogram and nucleus accumbens.
  • Expert–Novice Level Classification Using Graph Convolutional Network Introducing Confidence-Aware Node-Level Attention Mechanism
    Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    Sensors, 24, 10, 3033, 3033, MDPI AG, 2024年05月10日
    研究論文(学術雑誌), In this study, we propose a classification method of expert–novice levels using a graph convolutional network (GCN) with a confidence-aware node-level attention mechanism. In classification using an attention mechanism, highlighted features may not be significant for accurate classification, thereby degrading classification performance. To address this issue, the proposed method introduces a confidence-aware node-level attention mechanism into a spatiotemporal attention GCN (STA-GCN) for the classification of expert–novice levels. Consequently, our method can contrast the attention value of each node on the basis of the confidence measure of the classification, which solves the problem of classification approaches using attention mechanisms and realizes accurate classification. Furthermore, because the expert–novice levels have ordinalities, using a classification model that considers ordinalities improves the classification performance. The proposed method involves a model that minimizes a loss function that considers the ordinalities of classes to be classified. By implementing the above approaches, the expert–novice level classification performance is improved.
  • Analysis of Continual Learning Techniques for Image Generative Models with Learned Class Information Management.
    Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 24, 10, 3087, 3087, 2024年05月
    研究論文(学術雑誌)
  • A Novel Frame-Selection Metric for Video Inpainting to Enhance Urban Feature Extraction.
    Yuhu Feng, Jiahuan Zhang, Guang Li 0008, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 24, 10, 3035, 3035, 2024年05月
    研究論文(学術雑誌)
  • Algal Bed Region Segmentation Based on a ViT Adapter Using Aerial Images for Estimating CO2 Absorption Capacity.
    Guang Li 0008, Ren Togo, Keisuke Maeda, Akinori Sako, Isao Yamauchi, Tetsuya Hayakawa, Shigeyuki Nakamae, Takahiro Ogawa 0001, Miki Haseyama
    Remote. Sens., 16, 10, 1742, 1742, 2024年05月
    研究論文(学術雑誌)
  • Confidence-Aware Spatial-Temporal Attention Graph Convolutional Network for Skeleton-Based Expert-Novice Level Classification
    Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    ICASSP 2024 - 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), IEEE, 2024年04月14日
    研究論文(国際会議プロシーディングス)
  • Parameter-efficient tuning of cross-modal retrieval for a specific database via trainable textual and visual prompts.
    Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Int. J. Multim. Inf. Retr., 13, 1, 14, 14, 2024年03月
    研究論文(学術雑誌)
  • Flexibly manipulating popularity bias for tackling trade-offs in recommendation.
    Hiroki Okamura, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Inf. Process. Manag., 61, 2, 103606, 103606, 2024年03月
    研究論文(学術雑誌)
  • Text-Guided Image Editing Based on Post Score for Gaining Attention on Social Media.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 24, 3, 921, 921, 2024年02月
    研究論文(学術雑誌)
  • MLLM-based Automatic Exploration of Editing Prompt for High Engagement Image Generation.
    Kenta Kubota, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 1165, 1166, 2024年
    研究論文(国際会議プロシーディングス)
  • An Evaluation Metric for Single Image-to-3D Models Based on a Class Confidence Score of Object Detection Models.
    Yuiko Uchida, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 1163, 1164, 2024年
    研究論文(国際会議プロシーディングス)
  • Improving Zero-shot Adversarial Robustness via Integrating Image Features of Foundation Models.
    Koshiro Toishi, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 148, 149, 2024年
    研究論文(国際会議プロシーディングス)
  • Emotion-conditional Image Generation Reflecting Semantic Alignment with Text-to-Image Models.
    Kaede Hayakawa, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 10, 11, 2024年
    研究論文(国際会議プロシーディングス)
  • Structured Polyphonic Music Generation with Diffusion Transformer.
    Jinlong Zhu, Keigo Sakurai, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 8, 9, 2024年
    研究論文(国際会議プロシーディングス)
  • ブルーカーボンによるCO2吸収量推計へ向けた大規模セマンティックセグメンテーションモデルに基づく藻場領域の自動認識
    李 広, 藤後 廉, 前田 圭介, 酒向 章哲, 山内 功, 早川 哲也, 中前 茂之, 小川 貴弘, 長谷山 美紀
    土木学会論文集, 80, 17, n/a, 公益社団法人 土木学会, 2024年
    日本語, 沿岸藻場のCO2吸収量の測定は,カーボンニュートラル実現に向けた重要課題の一つであるが,UAV画像からの藻場領域の特定には多大な労力と経験を必要とする.本研究では,UAV画像を用いた藻場領域の自動認識手法を提案する.本手法では,画素レベルの意味的領域分割を可能とするモデルを利用し,最新モデルの一つであるViT-Adapterを採用する.本技術の利点は,学習済み大規模モデルの知識を有効活用して藻場領域認識を行う点であり,モデルのパラメータ調整により画素レベルでの海藻の識別を実現する.本研究では,航空写真から目視により藻場領域を特定したマスク画像を用いた学習を行い,さらに,UAV画像へ適応するためにデータ拡張等の処理を検討した.北海道えりも沿岸のUAV画像を用いた実証を行い,有効性を確認した.
  • Generative Dataset Distillation: Balancing Global Structure and Local Details.
    Longzhen Li, Guang Li 0008, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    CVPR Workshops, 7664, 7671, 2024年
    研究論文(国際会議プロシーディングス)
  • Cross-domain Few-shot In-context Learning for Enhancing Traffic Sign Recognition.
    Yaozong Gan, Guang Li 0008, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2407.05814, 2024年
    研究論文(学術雑誌)
  • Zero-shot Composed Image Retrieval Considering Query-target Relationship Leveraging Masked Image-text Pairs.
    Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2406.18836, 2024年
    研究論文(学術雑誌)
  • Prompt-based Personalized Federated Learning for Medical Visual Question Answering.
    He Zhu, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2402.09677, 2024年
    研究論文(学術雑誌)
  • Importance-Aware Adaptive Dataset Distillation.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2401.15863, 2024年
    研究論文(学術雑誌)
  • Multi-Object Editing in Personalized Text-To-Image Diffusion Model Via Segmentation Guidance.
    Haruka Matsuda, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 8140, 8144, 2024年
    研究論文(国際会議プロシーディングス)
  • Caption Unification for Multi-View Lifelogging Images Based on In-Context Learning with Heterogeneous Semantic Contents.
    Masaya Sato, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 8085, 8089, 2024年
    研究論文(国際会議プロシーディングス)
  • Enhancing Noisy Label Learning Via Unsupervised Contrastive Loss with Label Correction Based on Prior Knowledge.
    Masaki Kashiwagi, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 6235, 6239, 2024年
    研究論文(国際会議プロシーディングス)
  • Prompt-Based Personalized Federated Learning for Medical Visual Question Answering.
    He Zhu, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1821, 1825, 2024年
    研究論文(国際会議プロシーディングス)
  • Importance-aware adaptive dataset distillation.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Neural Networks, 172, 106154, 106154, 2024年
    研究論文(学術雑誌)
  • Dataset Distillation Using Parameter Pruning.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    IEICE Trans. Fundam. Electron. Commun. Comput. Sci., 107, 6, 936, 940, 2024年
    研究論文(学術雑誌)
  • 地下鉄トンネル点検における技術者のモーションデータを用いた熟練度分類 -説明可能なGraph Convolutional Networkの導入-
    清野 竜生, 斉藤 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    AI・データサイエンス論文集, 5, 1, 101, 109, 公益社団法人 土木学会, 2024年
    日本語, インフラ設備の正確かつ効率的な維持管理業務を遂行するためには,熟練技術者が有する優れた点検技術(熟練技術)を若手技術者へ継承する必要がある.多くの時間と労力を要する熟練技術の継承を支援するためには,点検に重要な動作を明確にする必要がある.しかしながら,従来の研究では,視線・動作などの生体情報を用いた熟練度分類と点検技術の熟練度と生体情報間の関連性分析に留まっている.そこで本論文では,若手技術者への技術継承支援に向け,熟練度分類および分類に重要な要素を可視化する手法を提案する.提案手法では,点検中の技術者から得られたモーションデータを用いて,熟練度分類の確信度を考慮することで重要な要素を強調するAttention機構を導入したグラフ畳み込みネットワークにより,説明可能な熟練度分類を実現する.
  • 工事現場映像における深度情報を活用した重機接触事故リスクの推定
    五箇 亮太, 前田 圭介, 藤後 廉, 小川 貴弘, 長谷山 美紀
    人工知能学会全国大会論文集, JSAI2024, 2C6GS701, 2C6GS701, 一般社団法人 人工知能学会, 2024年
    日本語, 建設業において,労働災害リスクの低減や安全性の向上は急務であり,近年では工事現場の安全性向上を目的とした重機との接触事故リスクを推定する手法が提案されている.既存研究では,工事現場で撮影された映像中より検出された作業員や重機の関係から接触事故リスクを推定しているものの,検出物体間の奥行きを考慮していなかった.これに対して本稿では,映像中の空間情報を補完するために深度情報を活用した接触事故リスク推定を可能とする深層学習モデルを提案する.実験の結果,映像中の作業員・重機間の空間的関係を考慮した接触事故リスクの推定において,提案手法は既存手法よりも高い性能を達成することが示された.
  • Reinforcing Pre-trained Models Using Counterfactual Images.
    Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2406.13316, 2024年
    研究論文(学術雑誌)
  • Generative Dataset Distillation: Balancing Global Structure and Local Details.
    Longzhen Li, Guang Li 0008, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2404.17732, 2024年
    研究論文(学術雑誌)
  • Enhancing Generative Class Incremental Learning Performance with Model Forgetting Approach.
    Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2403.18258, 2024年
    研究論文(学術雑誌)
  • Automatic Findings Generation for Distress Images Using In-Context Few-Shot Learning of Visual Language Model Based on Image Similarity and Text Diversity.
    Yuto Watanabe, Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    J. Robotics Mechatronics, 36, 2, 353, 364, 2024年
    研究論文(学術雑誌)
  • Individual Persistence Adaptation for User-Centric Evaluation of User Satisfaction in Recommender Systems.
    Nozomu Onodera, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    IEEE Access, 12, 23626, 23635, 2024年
    研究論文(学術雑誌)
  • Zero-Shot Traffic Sign Recognition Based on Midlevel Feature Matching
    Yaozong Gan, Guang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    Sensors, 23, 23, 9607, 9607, MDPI AG, 2023年12月04日
    研究論文(学術雑誌), Traffic sign recognition is a complex and challenging yet popular problem that can assist drivers on the road and reduce traffic accidents. Most existing methods for traffic sign recognition use convolutional neural networks (CNNs) and can achieve high recognition accuracy. However, these methods first require a large number of carefully crafted traffic sign datasets for the training process. Moreover, since traffic signs differ in each country and there is a variety of traffic signs, these methods need to be fine-tuned when recognizing new traffic sign categories. To address these issues, we propose a traffic sign matching method for zero-shot recognition. Our proposed method can perform traffic sign recognition without training data by directly matching the similarity of target and template traffic sign images. Our method uses the midlevel features of CNNs to obtain robust feature representations of traffic signs without additional training or fine-tuning. We discovered that midlevel features improve the accuracy of zero-shot traffic sign recognition. The proposed method achieves promising recognition results on the German Traffic Sign Recognition Benchmark open dataset and a real-world dataset taken from Sapporo City, Japan.
  • Manipulation Direction: Evaluating Text-Guided Image Manipulation Based on Similarity between Changes in Image and Text Modalities.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 23, 22, 9287, 9287, 2023年11月
    研究論文(学術雑誌)
  • Skill Level Classification Using Motion Data via Spatial Temporal Graph Convolutional Network
    Tatsuki Seino, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    2023 IEEE 12th Global Conference on Consumer Electronics (GCCE), IEEE, 2023年10月10日
    研究論文(国際会議プロシーディングス)
  • Visual Emotion Recognition Through Multimodal Cyclic-Label Dequantized Gaussian Process Latent Variable Model.
    Naoki Saito 0006, Keisuke Maeda, Takahiro Ogawa 0001, Satoshi Asamizu, Miki Haseyama
    Journal of Robotics and Mechatronics, 35, 5, 1321, 1330, 2023年10月
    研究論文(学術雑誌)
  • Self-supervised learning for gastritis detection with gastric X-ray images.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    International Journal of Computer Assisted Radiology and Surgery, 18, 10, 1841, 1848, 2023年10月
    研究論文(学術雑誌)
  • Zero-Shot Neural Decoding with Semi-Supervised Multi-View Embedding.
    Yusuke Akamatsu, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 23, 15, 6903, 6903, 2023年08月
    研究論文(学術雑誌)
  • Off-Screen Sound Separation Based on Audio-visual Pre-training Using Binaural Audio
    Masaki Yoshida, Ren Togo, Takahiro Ogawa, Miki Haseyama
    SENSORS, 23, 9, 4540, 4540, MDPI, 2023年05月
    英語, 研究論文(学術雑誌), This study proposes a novel off-screen sound separation method based on audio-visual pre-training. In the field of audio-visual analysis, researchers have leveraged visual information for audio manipulation tasks, such as sound source separation. Although such audio manipulation tasks are based on correspondences between audio and video, these correspondences are not always established. Specifically, sounds coming from outside a screen have no audio-visual correspondences and thus interfere with conventional audio-visual learning. The proposed method separates such off-screen sounds based on their arrival directions using binaural audio, which provides us with three-dimensional sensation. Furthermore, we propose a new pre-training method that can consider the off-screen space and use the obtained representation to improve off-screen sound separation. Consequently, the proposed method can separate off-screen sounds irrespective of the direction from which they arrive. We conducted our evaluation using generated video data to circumvent the problem of difficulty in collecting ground truth for off-screen sounds. We confirmed the effectiveness of our methods through off-screen sound detection and separation tasks.
  • Multimodal Natural Language Explanation Generation for Visual Question Answering Based on Multiple Reference Data
    He Zhu, Ren Togo, Takahiro Ogawa, Miki Haseyama
    ELECTRONICS, 12, 10, MDPI, 2023年05月
    英語, 研究論文(学術雑誌), As deep learning research continues to advance, interpretability is becoming as important as model performance. Conducting interpretability studies to understand the decision-making processes of deep learning models can improve performance and provide valuable insights for humans. The interpretability of visual question answering (VQA), a crucial task for human-computer interaction, has garnered the attention of researchers due to its wide range of applications. The generation of natural language explanations for VQA that humans can better understand has gradually supplanted heatmap representations as the mainstream focus in the field. Humans typically answer questions by first identifying the primary objects in an image and then referring to various information sources, both within and beyond the image, including prior knowledge. However, previous studies have only considered input images, resulting in insufficient information that can lead to incorrect answers and implausible explanations. To address this issue, we introduce multiple references in addition to the input image. Specifically, we propose a multimodal model that generates natural language explanations for VQA. We introduce outside knowledge using the input image and question and incorporate object information into the model through an object detection module. By increasing the information available during the model generation process, we significantly improve VQA accuracy and the reliability of the generated explanations. Moreover, we employ a simple and effective feature fusion joint vector to combine information from multiple modalities while maximizing information preservation. Qualitative and quantitative evaluation experiments demonstrate that the proposed method can generate more reliable explanations than state-of-the-art methods while maintaining answering accuracy.
  • Boosting automatic COVID-19 detection performance with self-supervised learning and batch knowledge ensembling.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Comput. Biol. Medicine, 158, 106877, 106877, 2023年05月
    研究論文(学術雑誌)
  • 画像の感情推定のためのラベル逆量子化を導入した正準相関分析
    斉藤 直輝, 前田 圭介, 小川 貴弘, 浅水 仁, 長谷山 美紀
    電子情報通信学会論文誌D 情報・システム, J106-D, 5, 337, 348, The Institute of Electronics, Information and Communication Engineers, 2023年05月01日
    日本語, 本論文では,画像の感情推定のためのラベル逆量子化を導入した正準相関分析であるSupervised Multi-view Canonical Correlation Analysis via Cyclic Label Dequantization (sMVCCA-CLD)を提案する.ラベルから算出される特徴量(ラベル特徴量)の次元数は他の特徴量と比較して小さいため,従来のCCAでは,構築する空間の次元数の低下により特徴量間の相関関係の表現が困難となる問題点が存在する.そこで,sMVCCA-CLDでは,ラベル特徴量の次元数をラベル逆量子化により増加させながら,特徴量間の相関を最大化することで,次元数の制約を受けない共通潜在空間の構築を可能とする.更に,感情が円環状に配置されることを考慮してラベル逆量子化を行うことで,感情推定に適した共通潜在空間の構築を可能とする.以上で構築された空間に射影された新たな特徴量を利用することで,高精度な感情推定が可能となる.
  • COVID-19 detection based on self-supervised transfer learning using chest X-ray images.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Int. J. Comput. Assist. Radiol. Surg., 18, 4, 715, 722, 2023年04月
    研究論文(学術雑誌)
  • Estimation of Degradation Degree in Road Infrastructure Based on Multi-Modal ABN Using Contrastive Learning.
    Takaaki Higashi, Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 23, 3, 1657, 1657, 2023年02月
    研究論文(学術雑誌)
  • Diversity Learning Based on Multi-Latent Space for Medical Image Visual Question Generation.
    He Zhu, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 23, 3, 1057, 1057, MDPI, 2023年02月
    英語, 研究論文(学術雑誌), Auxiliary clinical diagnosis has been researched to solve unevenly and insufficiently distributed clinical resources. However, auxiliary diagnosis is still dominated by human physicians, and how to make intelligent systems more involved in the diagnosis process is gradually becoming a concern. An interactive automated clinical diagnosis with a question-answering system and a question generation system can capture a patient's conditions from multiple perspectives with less physician involvement by asking different questions to drive and guide the diagnosis. This clinical diagnosis process requires diverse information to evaluate a patient from different perspectives to obtain an accurate diagnosis. Recently proposed medical question generation systems have not considered diversity. Thus, we propose a diversity learning-based visual question generation model using a multi-latent space to generate informative question sets from medical images. The proposed method generates various questions by embedding visual and language information in different latent spaces, whose diversity is trained by our newly proposed loss. We have also added control over the categories of generated questions, making the generated questions directional. Furthermore, we use a new metric named similarity to accurately evaluate the proposed model's performance. The experimental results on the Slake and VQA-RAD datasets demonstrate that the proposed method can generate questions with diverse information. Our model works with an answering model for interactive automated clinical diagnosis and generates datasets to replace the process of annotation that incurs huge labor costs.
  • Visual language modelを用いた変状画像に対する所見の自動生成—類似画像検索によるFew-shot learningの導入—
    渡邉 優宇人, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    AI・データサイエンス論文集, 4, 3, 223, 232, 公益社団法人 土木学会, 2023年
    日本語, 本研究では,インフラ施設の点検過程で作成される点検記録に必要な所見の効率的な作成支援のため,Visual language modelを活用した所見の自動生成手法を提案する.変状画像から認識可能な事柄に加えて,技術者の判断や意見を含む文章である所見は点検記録の作成に不可欠であるが,その直接的な生成に対する議論は依然として少なく,所見の効率的な作成支援に向けた生成技術の実現が期待されている.そこで本稿では,近年,注目されている大規模言語モデルの応用研究である視覚と言語の双方を高精度に理解したテキスト出力を可能とするVisual language modelに対して,変状画像に対する類似画像検索に基づくFew-shot learningを導入することで,少数の変状画像および所見の組から効率的にその関係性を把握可能とする.本稿の最後では,実際の橋梁点検記録に含まれる変状画像から所見を生成する検証により,提案手法の有効性を確認する.
  • Attention-based Multiple Instance Learningに基づく背景の多様性に頑健な道路附属物の異状判定
    渡部 航史, 小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    AI・データサイエンス論文集, 4, 3, 482, 489, 公益社団法人 土木学会, 2023年
    日本語, 本稿では,道路附属物の画像から異状の有無を判定する手法について提案を行う.道路標識や照明などの設備である道路附属物は,その設置数と設置範囲の広大さから点検の効率化が望まれており,現在ドローンを用いた自動点検技術の実現が期待されている.ドローンより撮像される道路附属物の画像には地面や空,道路など,多様な背景が含まれているが,従来研究ではこれらの背景の多様性を考慮できていなかった.そこで,本研究ではAttention機構を導入したMultiple Instance Learningを適用した異状判定手法を構築する.パッチ分割した撮像画像を入力し,各パッチの重要度を推定することで,背景領域と道路附属物の領域を区別した異状の学習を実現する.本稿の最後では,実際の道路附属物の画像を用いた実験を行い,7割程度の分類精度を達成し本研究のアプローチの有効性が確認された.
  • 社会インフラ点検時の変状画像を対象とした変状種と劣化レベルのマルチタスク分類
    小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    AI・データサイエンス論文集, 4, 3, 807, 814, 公益社団法人 土木学会, 2023年
    日本語, 本論文では,変状の種類(変状種)と進行度(劣化レベル)を同時に分類するマルチタスク分類手法を提案する.従来では,変状種毎に劣化レベルを分類するモデルの学習を行っていた.これに対し,提案手法では,学習時に変状種と劣化レベルを用いた損失の最小化を行うことで,あらかじめ画像に変状種を付与せずとも変状種の分類結果を考慮して劣化レベルを分類可能とする.本論文の最後では,実際に社会インフラに発生した変状を撮影した画像を用いた実験により,提案手法のモデルが変状種毎に構築したモデルに匹敵する劣化レベルの分類精度を達成可能であることを確認する.
  • 社会インフラ維持管理効率化に向けた最先端AI研究
    前田 圭介, 小川 貴弘, 長谷山 美紀
    AI・データサイエンス論文集, 4, 3, 982, 989, 公益社団法人 土木学会, 2023年
    日本語, AI技術の発展・高度化により,社会インフラ維持管理分野へのAI応用に関する研究が活発に進められている.これらの研究の多くは,維持管理業務等で得られる画像の性質を考慮した学習理論の構築に注目しており,ひび割れ検出や変状の種類分類,劣化レベル推定等,様々なタスクにおいて,AIの有効性が示されている.一方,真に業務効率化を実現するAIを構築するためには,実務に必要な機能を備えたAIを構築する必要がある.さらに,構築したAIを高度化し,継続的に活用するためには,実務においてAI構築に適した画像を取得する必要がある.そこで,本稿では,維持管理業務等で得られる画像を対象に構築されてきた学習理論,実務に必要な機能を備えたAI構築に関する従来研究および画像の取得方法に関する著者らの考えについて紹介する.
  • セマンティックセグメンテーションに基づく道路走行中の車載映像を用いた枯損木の検出
    小川 直輝, 前田 圭介, 小川 貴弘, 長谷山 美紀
    AI・データサイエンス論文集, 4, 3, 686, 693, 公益社団法人 土木学会, 2023年
    日本語, 本稿では,道路走行中の車両から撮影した映像を用いた枯損木の自動検出に関する手法を提案する.提案手法では,多様な物体が撮影された映像中からセマンティックセグメンテーションに基づき樹木領域を抽出する.さらに,抽出した領域から色彩情報を用いて枯損木を検出する.提案手法により検出した枯損木の領域を技術者へ提示することで,技術者が効率的に枯損木を発見できるように支援する.本稿の最後では,実際の車載映像を用いた実験により提案手法の有効性を検証する.
  • Feature Integration via Back-Projection Ordering Multi-Modal Gaussian Process Latent Variable Model for Rating Prediction.
    Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 3125, 3129, 2023年
    研究論文(国際会議プロシーディングス)
  • Multi-View Variational Recurrent Neural Network for Human Emotion Recognition Using Multi-Modal Biological Signals.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 2925, 2929, 2023年
    研究論文(国際会議プロシーディングス)
  • Video-Music Retrieval with Fine-Grained Cross-Modal Alignment.
    Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 2005, 2009, 2023年
    研究論文(国際会議プロシーディングス)
  • Text-Guided Facial Image Manipulation for Wild Images via Manipulation Direction-Based Loss.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 361, 365, 2023年
    研究論文(国際会議プロシーディングス)
  • Text-to-image Diffusion Model Suppressing Catastrophic Forgetting via Elastic Weight Consolidation.
    Haruka Matsuda, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 831, 832, 2023年
    研究論文(国際会議プロシーディングス)
  • Deterioration Level Estimation for Infrastructures Considering Noisy Labels via DivideMix.
    Masaki Kashiwagi, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 829, 830, 2023年
    研究論文(国際会議プロシーディングス)
  • Novel Feature Extraction for Classification of Auditory-visual Stimuli from fNIRS Signals.
    Taro Togo, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 759, 760, 2023年
    研究論文(国際会議プロシーディングス)
  • A Controllable Recoloring Method for Novel Views Using Segment Anything Model.
    Haoyang Wang, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 587, 588, 2023年
    研究論文(国際会議プロシーディングス)
  • Caption Unification for Multiple Viewpoint Lifelogging Images and Its Verification.
    Masaya Sato, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 415, 416, 2023年
    研究論文(国際会議プロシーディングス)
  • Improving Visual Counterfactual Explanation Models for Image Classification via CLIP.
    Xiang Li, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 390, 391, 2023年
    研究論文(国際会議プロシーディングス)
  • 画像の感情推定のためのラベル逆量子化を導入した正準相関分析
    斉藤直輝, 前田圭介, 小川貴弘, 浅水仁, 長谷山美紀
    電子情報通信学会論文誌 D(Web), J106-D, 5, 2023年
  • Few-Shot Personalized Saliency Prediction Using Tensor Regression for Preserving Structural Global Information.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2307.02799, 2023年
    研究論文(学術雑誌)
  • Personalized Content Recommender System via Non-verbal Interaction Using Face Mesh and Facial Expression.
    Yuya Moroto, Rintaro Yanagi, Naoki Ogawa, Kyohei Kamikawa, Keigo Sakurai, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ACM Multimedia, 9399, 9401, 2023年
    研究論文(国際会議プロシーディングス)
  • Gromov-Wasserstein Autoencoders.
    Nao Nakagawa, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICLR, 2023年
    研究論文(国際会議プロシーディングス)
  • Proficiency-level Estimation Using Heterogeneous Features via Label Dequantized CCA.
    Tatsuki Seino, Naoki Saito 0006, Takahiro Ogawa 0001, Satoshi Asamizu, Miki Haseyama
    ICCE-Taiwan, 813, 814, 2023年
    研究論文(国際会議プロシーディングス)
  • Parameter-efficient Tuning of a Pre-trained Model via Prompt Learning in Cross-modal Retrieval.
    Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-Taiwan, 811, 812, 2023年
    研究論文(国際会議プロシーディングス)
  • Binaural Audio Generation with Data Augmentation from 360° Videos.
    Masaki Yoshida, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-Taiwan, 795, 796, 2023年
    研究論文(国際会議プロシーディングス)
  • Prediction of Shoot Events by Considering Spatio-temporal Relations of Multimodal Features.
    Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-Taiwan, 793, 794, 2023年
    研究論文(国際会議プロシーディングス)
  • Shoot Event Prediction in Soccer Considering Expected Goals Based on Players' Positions.
    Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-Taiwan, 449, 450, 2023年
    研究論文(国際会議プロシーディングス)
  • Estimation of Amyloid-β Positivity Using QSM Images Considering Age Information.
    Tsubasa Kunieda, Ren Togo, Noriko Nishioka, Yukie Shimizu, Shiro Watanabe, Kenji Hirata, Keisuke Maeda, Takahiro Ogawa 0001, Kohsuke Kudo, Miki Haseyama
    ICCE-Taiwan, 165, 166, 2023年
    研究論文(国際会議プロシーディングス)
  • A Medical Domain Visual Question Generation Model via Large Language Model.
    He Zhu, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-Taiwan, 163, 164, 2023年
    研究論文(国際会議プロシーディングス)
  • Defense Against Black-Box Adversarial Attacks Via Heterogeneous Fusion Features.
    Jiahuan Zhang, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1, 5, 2023年
    研究論文(国際会議プロシーディングス)
  • Binauralization Robust To Camera Rotation Using 360° Videos.
    Masaki Yoshida, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1, 5, 2023年
    研究論文(国際会議プロシーディングス)
  • Learning Graph Laplacian from Intrinsic Patterns via Gaussian Process.
    Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1, 5, 2023年
    研究論文(国際会議プロシーディングス)
  • Estimation of Visual Contents from Human Brain Signals via VQA Based on Brain-Specific Attention.
    Ryo Shichida, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1, 5, 2023年
    研究論文(国際会議プロシーディングス)
  • Class-Aware Shared Gaussian Process Dynamic Model.
    Ryosuke Sawata, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1, 5, 2023年
    研究論文(国際会議プロシーディングス)
  • Improving Dropout in Graph Convolutional Networks for Recommendation via Contrastive Loss.
    Hiroki Okamura, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1, 5, 2023年
    研究論文(国際会議プロシーディングス)
  • Multi-Label Classification in Anime Illustrations Based on Hierarchical Attribute Relationships.
    Ziwen Lan, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 23, 10, 4798, 4798, 2023年
    研究論文(学術雑誌)
  • Prediction of Shooting Events in Soccer Videos Using Complete Bipartite Graphs and Players' Spatial-Temporal Relations.
    Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 23, 9, 4506, 4506, 2023年
    研究論文(学術雑誌)
  • Material Compound-Property Retrieval Using Electron Microscope Images for Rubber Material Development.
    Rintaro Yanagi, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    IEEE Access, 11, 88258, 88264, 2023年
    研究論文(学術雑誌)
  • Hierarchical Multi-Label Attribute Classification With Graph Convolutional Networks on Anime Illustration.
    Ziwen Lan, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    IEEE Access, 11, 35447, 35456, 2023年
    研究論文(学術雑誌)
  • SpectralMAP: Approximating Data Manifold With Spectral Decomposition
    Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE ACCESS, 11, 31530, 31540, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2023年
    英語, 研究論文(学術雑誌), Dimensionality reduction is widely used to visualize complex high-dimensional data. This study presents a novel method for effective data visualization. Previous methods depend on local distance measurements for data manifold approximation. This leads to unreliable results when a data manifold locally oscillates because of some undesirable effects, such as noise effects. In this study, we overcome this limitation by introducing a dual approximation of a data manifold. We roughly approximate a data manifold with a neighborhood graph and prune it with a global filter. This dual scheme results in local oscillation robustness and yields effective visualization with explicit global preservation. We consider a global filter based on principal component analysis frameworks and derive it with the spectral information of the original high-dimensional data. Finally, we experiment with multiple datasets to verify our method, compare its performance to that of state-of-the-art methods, and confirm the effectiveness of our novelty and results.
  • Summarizing Data Structures with Gaussian Process and Robust Neighborhood Preservation
    Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    MACHINE LEARNING AND KNOWLEDGE DISCOVERY IN DATABASES, ECML PKDD 2022, PT V, 13717, 157, 173, SPRINGER INTERNATIONAL PUBLISHING AG, 2023年
    英語, 研究論文(国際会議プロシーディングス), Latent variable models summarize high-dimensional data while preserving its many complex properties. This paper proposes a locality-aware and low-rank approximated Gaussian process latent variable model (LolaGP) that can preserve the global relationship and local geometry in the derivation of the latent variables. We realize the global relationship by imitating the sample similarity non-linearly and the local geometry based on our newly constructed neighborhood graph. Formally, we derive LolaGP from GP-LVM and implement a locality-aware regularization to reflect its adjacency relationship. The neighborhood graph is constructed based on the latent variables, making the local preservation more resistant to noise disruption and the curse of dimensionality than the previous methods that directly construct it from the high-dimensional data. Furthermore, we introduce a new lower bound of a log-posterior distribution based on low-rank matrix approximation, which allows LolaGP to handle larger datasets than the conventional GP-LVM extensions. Our contribution is to preserve both the global and local structures in the derivation of the latent variables using the robust neighborhood graph and introduce the scalable lower bound of the log-posterior distribution. We conducted an experimental analysis using synthetic as well as images with and without highly noise disrupted datasets. From both qualitative and quantitative standpoint, our method produced successful results in all experimental settings.
  • Recallable Question Answering-Based Re-Ranking Considering Semantic Region for Cross-Modal Retrieval
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE OPEN JOURNAL OF SIGNAL PROCESSING, 4, 1, 11, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2023年
    英語, 研究論文(学術雑誌), Question answering (QA)-based re-ranking methods for cross-modal retrieval have been recently proposed to further narrow down similar candidate images. The conventional QA-based re-ranking methods provide questions to users by analyzing candidate images, and the initial retrieval results are re-ranked based on the user's feedback. Contrary to these developments, only focusing on performance improvement makes it difficult to efficiently elicit the user's retrieval intention. To realize more useful QA-based re-ranking, considering the user interaction for eliciting the user's retrieval intention is required. In this paper, we propose a QA-based re-ranking method with considering two important factors for eliciting the user's retrieval intention: query-image relevance and recallability. Considering the query-image relevance enables to only focus on the candidate images related to the provided query text, while, focusing on the recallability enables users to easily answer the provided question. With these procedures, our method can efficiently and effectively elicit the user's retrieval intention. Experimental results using Microsoft Common Objects in Context and computationally constructed dataset including similar candidate images show that our method can improve the performance of the cross-modal retrieval methods and the QA-based re-ranking methods.
  • Interpretable Visual Question Answering Referring to Outside Knowledge.
    He Zhu, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2303.04388, 2023年
    研究論文(学術雑誌)
  • Text-Guided Image Manipulation via Generative Adversarial Network With Referring Image Segmentation-Based Guidance.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    IEEE Access, 11, 42534, 42545, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2023年
    英語, 研究論文(学術雑誌), This study proposes a novel text-guided image manipulation method that introduces referring image segmentation into a generative adversarial network. The proposed text-guided image manipulation method aims to manipulate images containing multiple objects while preserving text-unrelated regions. The proposed method assigns the task of distinguishing between text-related and unrelated regions in an image to segmentation guidance based on referring image segmentation. With this architecture, the adversarial generative network can focus on generating new attributes according to the text description and reconstructing text-unrelated regions. For the challenging input images with multiple objects, the experimental results demonstrate that the proposed method outperforms conventional methods in terms of image manipulation precision.
  • Cross-Modal Image Retrieval Considering Semantic Relationships With Many-to-Many Correspondence Loss.
    Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    IEEE Access, 11, 10675, 10686, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2023年
    英語, 研究論文(学術雑誌), A cross-modal image retrieval that explicitly considers semantic relationships between images and texts is proposed. Most conventional cross-modal image retrieval methods retrieve the target images by directly measuring the similarities between the candidate images and query texts in a common semantic embedding space. However, such methods tend to focus on a one-to-one correspondence between a predefined image-text pair during the training phase, and other semantically similar images and texts are ignored. By considering the many-to-many correspondences between semantically similar images and texts, a common embedding space is constructed to assure semantic relationships, which allows users to accurately find more images that are related to the input query texts. Thus, in this paper, we propose a cross-modal image retrieval method that considers semantic relationships between images and texts. The proposed method calculates the similarities between texts as semantic similarities to acquire the relationships. Then, we introduce a loss function that explicitly constructs the many-to-many correspondences between semantically similar images and texts from their semantic relationships. We also propose an evaluation metric to assess whether each method can construct an embedding space considering the semantic relationships. Experimental results demonstrate that the proposed method outperforms conventional methods in terms of this newly proposed metric.
  • Similar interior coordination image retrieval with multi-view features
    Ren Togo, Yuki Honma, Maiku Abe, Takahiro Ogawa, Miki Haseyama
    International Journal of Multimedia Information Retrieval, 11, 4, 731, 740, Springer Science and Business Media LLC, 2022年08月26日
    英語, 研究論文(学術雑誌), This paper presents a novel similar image retrieval method for interior coordination. Interior coordination is very familiar; however, it is still an abstract and difficult concept. Even if we are involved in coordination every day, it does not mean we can become professional coordinators. By realizing the retrieval that can provide similar interior coordination images from a query room image, inspiring users' ideas for interior coordination becomes feasible. In the proposed method, we extract image features specialized for interior coordination and realize similar interior coordination image retrieval. We employ multi-view features: object-based, color-based, and semantic-based features, in the feature extraction phase. The extracted features are used to calculate similarity between the query image and the database images for the retrieval. We conducted experiments using a sophisticated real-world interior coordination image dataset. Furthermore, we qualitatively and quantitatively evaluated the effectiveness of the proposed method.
  • Brain Decoding of Multiple Subjects for Estimating Visual Information Based on a Probabilistic Generative Model
    Takaaki Higashi, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    SENSORS, 22, 16, 6148, 6148, MDPI, 2022年08月
    英語, 研究論文(学術雑誌), Brain decoding is a process of decoding human cognitive contents from brain activities. However, improving the accuracy of brain decoding remains difficult due to the unique characteristics of the brain, such as the small sample size and high dimensionality of brain activities. Therefore, this paper proposes a method that effectively uses multi-subject brain activities to improve brain decoding accuracy. Specifically, we distinguish between the shared information common to multi-subject brain activities and the individual information based on each subject's brain activities, and both types of information are used to decode human visual cognition. Both types of information are extracted as features belonging to a latent space using a probabilistic generative model. In the experiment, an publicly available dataset and five subjects were used, and the estimation accuracy was validated on the basis of a confidence score ranging from 0 to 1, and a large value indicates superiority. The proposed method achieved a confidence score of 0.867 for the best subject and an average of 0.813 for the five subjects, which was the best compared to other methods. The experimental results show that the proposed method can accurately decode visual cognition compared with other existing methods in which the shared information is not distinguished from the individual information.
  • Defect Detection of Subway Tunnels Using Advanced U-Net Network
    An Wang, Ren Togo, Takahiro Ogawa, Miki Haseyama
    SENSORS, 22, 6, 2330, 2330, MDPI, 2022年03月
    英語, 研究論文(学術雑誌), In this paper, we present a novel defect detection model based on an improved U-Net architecture. As a semantic segmentation task, the defect detection task has the problems of background-foreground imbalance, multi-scale targets, and feature similarity between the background and defects in the real-world data. Conventionally, general convolutional neural network (CNN)-based networks mainly focus on natural image tasks, which are insensitive to the problems in our task. The proposed method has a network design for multi-scale segmentation based on the U-Net architecture including an atrous spatial pyramid pooling (ASPP) module and an inception module, and can detect various types of defects compared to conventional simple CNN-based methods. Through the experiments using a real-world subway tunnel image dataset, the proposed method showed a better performance than that of general semantic segmentation including state-of-the-art methods. Additionally, we showed that our method can achieve excellent detection balance among multi-scale defects.
  • Microscopy and biomimetics: the NanoSuit® method and image retrieval platform
    Takahiko Hariyama, Yasuharu Takaku, Hideya Kawasaki, Masatsugu Shimomura, Chiyo Senoh, Yumi Yamahama, Atsushi Hozumi, Satoru Ito, Naoto Matsuda, Satoshi Yamada, Toshiya Itoh, Miki Haseyama, Takahiro Ogawa, Naoki Mori, Shuhei So, Hidefumi Mitsuno, Masahiro Ohara, Shuhei Nomura, Masao Hirasaka
    Microscopy, 71, 1, 1, 12, Oxford University Press (OUP), 2022年01月29日
    研究論文(学術雑誌), Abstract

    This review aims to clarify a suitable method towards achieving next-generation sustainability. As represented by the term ‘Anthropocene’, the Earth, including humans, is entering a critical era; therefore, science has a great responsibility to solve it. Biomimetics, the emulation of the models, systems and elements of nature, especially biological science, is a powerful tool to approach sustainability problems. Microscopy has made great progress with the technology of observing biological and artificial materials and its techniques have been continuously improved, most recently through the NanoSuit® method. As one of the most important tools across many facets of research and development, microscopy has produced a large amount of accumulated digital data. However, it is difficult to extract useful data for making things as biomimetic ideas despite a large amount of biological data. Here, we would like to find a way to organically connect the indispensable microscopic data with the new biomimetics to solve complex human problems.
  • Popularity-Aware Graph Social Recommendation for Fully Non-Interaction Users.
    Nozomu Onodera, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Proceedings of the 4th ACM International Conference on Multimedia in Asia(MMAsia), 30, 5, ACM, 2022年
    研究論文(国際会議プロシーディングス)
  • Affective Embedding Framework with Semantic Representations from Tweets for Zero-Shot Visual Sentiment Prediction.
    Yingrui Ye, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Proceedings of the 4th ACM International Conference on Multimedia in Asia(MMAsia), 6, 7, ACM, 2022年
    研究論文(国際会議プロシーディングス)
  • Visual Sentiment Prediction Using Cross-Way Few-Shot Learning Based on Knowledge Distillation.
    Yingrui Ye, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    2022 IEEE International Conference on Image Processing(ICIP), 3838, 3842, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Human-Centric Image Retrieval with Gaze-Based Image Captioning.
    Yuhu Feng, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    2022 IEEE International Conference on Image Processing(ICIP), 3828, 3832, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Few-Shot Personalized Saliency Prediction with Similarity of Gaze Tendency Using Object-Based Structural Information.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    2022 IEEE International Conference on Image Processing(ICIP), 3823, 3827, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Gaussian Distributed Graph Constrained Multi-Modal Gaussian Process Latent Variable Model for Ordinal Labeled Data.
    Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    2022 IEEE International Conference on Image Processing(ICIP), 3798, 3802, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • GCN-Based Multi-Modal Multi-Label Attribute Classification in Anime Illustration Using Domain-Specific Semantic Features.
    Ziwen Lan, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    2022 IEEE International Conference on Image Processing(ICIP), 2021, 2025, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Trend Prediction of Students' Mock Examination Results Using Matrix Completion.
    Yutaka Yamada, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    11th IEEE Global Conference on Consumer Electronics(GCCE), 891, 892, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Shoot Event Prediction from Soccer Videos by Considering Players' Spatio-Temporal Relations.
    Ryota Goka, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    11th IEEE Global Conference on Consumer Electronics(GCCE), 406, 407, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Refinement of Gaze-based Image Caption for Image Retrieval.
    Yuhu Feng, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    11th IEEE Global Conference on Consumer Electronics(GCCE), 272, 273, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Boosting Automatic COVID-19 Detection Performance with Self-Supervised Learning and Batch Knowledge Ensembling.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2212.09281, 2022年
    研究論文(学術雑誌)
  • COVID-19 Detection Based on Self-Supervised Transfer Learning Using Chest X-Ray Images.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2212.09276, 2022年
    研究論文(学術雑誌)
  • Union-set Multi-source Model Adaptation for Semantic Segmentation.
    Zongyao Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2212.02785, 2022年
    研究論文(学術雑誌)
  • RGMIM: Region-Guided Masked Image Modeling for COVID-19 Detection.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2211.00313, 2022年
    研究論文(学術雑誌)
  • Rubber Material Retrieval System using Electron Microscope Images for Rubber Material Development.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    MMAsia, 44, 3, ACM, 2022年
    研究論文(国際会議プロシーディングス)
  • Disentangled Image Attribute Editing in Latent Space via Mask-Based Retention Loss.
    Shunya Ohaga, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    MMAsia, 25, 7, ACM, 2022年
    研究論文(国際会議プロシーディングス)
  • Assessment of Image Manipulation Using Natural Language Description: Quantification of Manipulation Direction.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 1046, 1050, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Improving Model Adaptation for Semantic Segmentation by Learning Model-Invariant Features with Multiple Source-Domain Models.
    Zongyao Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 421, 425, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • A Multimodal Interpretable Visual Question Answering Model Introducing Image Caption Processor.
    He Zhu, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 777, 778, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Cross-modal Image Retrieval Considering Semantic Relationships with Object Information.
    Huaying Zhang, Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 775, 776, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Free-viewpoint Sports Video Generation Based on Dynamic NeRF Considering Time Series.
    Masato Kawai, Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 408, 409, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Content-based Image Retrieval Using Effective Synthesized Images from Different Camera Views via pixelNeRF.
    Yuki Era, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 404, 405, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Analysis of Relationships between Visual Cognitive Contents and Response of Each Brain Region via Visual Question Answering.
    Ryo Shichida, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 402, 403, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • GCN-based Collaborative Filtering Considering Personality Bias.
    Hiroki Okamura, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 278, 279, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Prediction of Amyloid-β Positivity Using QSM Images Based on Bootstrap Your Own Latent.
    Tsubasa Kunieda, Ren Togo, Noriko Nishioka, Yukie Shimizu, Shiro Watanabe, Kenji Hirata, Keisuke Maeda, Takahiro Ogawa 0001, Kohsuke Kudo, Miki Haseyama
    GCCE, 137, 138, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Cross-platform Recommendation Considering Common Users' Preferences Based on Preference Propagation GraphNet.
    Kazuki Yamamoto, Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 135, 136, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Union-Set Multi-source Model Adaptation for Semantic Segmentation.
    Zongyao Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ECCV (29), 579, 595, Springer, 2022年
    研究論文(国際会議プロシーディングス)
  • Trial Analysis of the Relationship between Taste and Biological Information Obtained While Eating Strawberries for Sensory Evaluation.
    Keisuke Maeda, Ren Togo, Takahiro Ogawa 0001, Shin-ichi Adachi, Fumiaki Yoshizawa, Miki Haseyama
    Sensors, 22, 23, 9496, 9496, 2022年
    研究論文(学術雑誌)
  • Distress Detection in Subway Tunnel Images via Data Augmentation Based on Selective Image Cropping and Patching.
    Keisuke Maeda, Saya Takada, Tomoki Haruyama, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 22, 22, 8932, 8932, 2022年
    研究論文(学術雑誌)
  • Compressed gastric image generation based on soft-label dataset distillation for medical data sharing.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Comput. Methods Programs Biomed., 227, 107189, 107189, 2022年
    研究論文(学術雑誌)
  • Dataset Complexity Assessment Based on Cumulative Maximum Scaled Area Under Laplacian Spectrum.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2209.14743, 2022年
    研究論文(学術雑誌)
  • Compressed Gastric Image Generation Based on Soft-Label Dataset Distillation for Medical Data Sharing.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2209.14635, 2022年
    研究論文(学術雑誌)
  • Dataset Distillation using Parameter Pruning.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2209.14609, 2022年
    研究論文(学術雑誌)
  • Dataset Distillation for Medical Dataset Sharing.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2209.14603, 2022年
    研究論文(学術雑誌)
  • Gromov-Wasserstein Autoencoders.
    Nao Nakagawa, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2209.07007, 2022年
    研究論文(学術雑誌)
  • TriBYOL: Triplet BYOL for Self-Supervised Representation Learning.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2206.03012, 2022年
    研究論文(学術雑誌)
  • Self-Knowledge Distillation based Self-Supervised Learning for Covid-19 Detection from Chest X-Ray Images.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    CoRR, abs/2206.03009, 2022年
    研究論文(学術雑誌)
  • Generating Captions of Imagined content from Human Brain Activities Applying An Image Captioning Model.
    Saya Takada, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    4th IEEE Global Conference on Life Sciences and Technologies(LifeTech), 614, 615, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Knowledge-Guided Sequential Recommendation with Reinforcement Learning Using Empirical Distribution Function.
    Keigo Sakurai, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    4th IEEE Global Conference on Life Sciences and Technologies(LifeTech), 187, 188, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Transformer Based Multimodal Scene Recognition in Soccer Videos.
    Yaozong Gan, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICME Workshops, 1, 6, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Scene Retrieval in Soccer Videos by Spatial-temporal Attention with Video Vision Transformer.
    Yaozong Gan, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-TW, 453, 454, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Multi-scale Defect Detection from Subway Tunnel Images with Spatial Attention Mechanism.
    An Wang, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICCE-TW, 305, 306, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • 橋梁点検時の技術者の一人称および三人称視点映像を用いた点検動作の分類に関する検討
    増田毅, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀
    映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 303, 304, IEEE, 2022年
  • TriBYOL: Triplet BYOL for Self-Supervised Representation Learning.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 3458, 3462, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Divergence-Guided Feature Alignment for Cross-Domain Object Detection.
    Zongyao Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 2240, 2244, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Self-Knowledge Distillation based Self-Supervised Learning for Covid-19 Detection from Chest X-Ray Images.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 1371, 1375, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Regularization Meets Enhanced Multi-Stage Fusion Features: Making CNN More Robust against White-Box Adversarial Attacks.
    Jiahuan Zhang, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 22, 14, 5431, 5431, MDPI, 2022年
    英語, 研究論文(学術雑誌), Regularization has become an important method in adversarial defense. However, the existing regularization-based defense methods do not discuss which features in convolutional neural networks (CNN) are more suitable for regularization. Thus, in this paper, we propose a multi-stage feature fusion network with a feature regularization operation, which is called Enhanced Multi-Stage Feature Fusion Network (EMSF(2)Net). EMSF(2)Net mainly combines three parts: multi-stage feature enhancement (MSFE), multi-stage feature fusion (MSF2), and regularization. Specifically, MSFE aims to obtain enhanced and expressive features in each stage by multiplying the features of each channel; MSF2 aims to fuse the enhanced features of different stages to further enrich the information of the feature, and the regularization part can regularize the fused and original features during the training process. EMSF(2)Net has proved that if the regularization term of the enhanced multi-stage feature is added, the adversarial robustness of CNN will be significantly improved. The experimental results on extensive white-box attacks on the CIFAR-10 dataset illustrate the robustness and effectiveness of the proposed method.
  • Controllable Music Playlist Generation Based on Knowledge Graph and Reinforcement Learning.
    Keigo Sakurai, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 22, 10, 3722, 3722, 2022年
    研究論文(学術雑誌)
  • Learning intra-domain style-invariant representation for unsupervised domain adaptation of semantic segmentation.
    Zongyao Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Pattern Recognit., 132, 108911, 108911, 2022年
    研究論文(学術雑誌)
  • Dataset complexity assessment based on cumulative maximum scaled area under Laplacian spectrum.
    Guang Li 0008, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    Multimedia Tools and Applications, 81, 22, 32287, 32303, 2022年
    研究論文(学術雑誌)
  • User-centric multimodal feature extraction for personalized retrieval of tumblr posts.
    Kazuma Ohtomo, Ryosuke Harakawa, Takahiro Ogawa 0001, Miki Haseyama, Masahiro Iwahashi
    Multimedia Tools and Applications, 81, 2, 2979, 3003, 2022年
    研究論文(学術雑誌)
  • Chain centre loss: A psychology inspired loss function for image sentiment analysis.
    Yun Liang 0014, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Neurocomputing, 495, 118, 128, 2022年
    研究論文(学術雑誌)
  • Generative Adversarial Network Including Referring Image Segmentation For Text-Guided Image Manipulation.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 4818, 4822, IEEE, 2022年
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a novel generative adversarial network to improve the performance of image manipulation using natural language descriptions that contain desired attributes. Text-guided image manipulation aims to semantically manipulate an image aligned with the text description while preserving text-irrelevant regions. To achieve this, we newly introduce referring image segmentation into the generative adversarial network for image manipulation. The referring image segmentation aims to generate a segmentation mask that extracts the text-relevant region. By utilizing the feature map of the segmentation mask in the network, the proposed method explicitly distinguishes the text-relevant and irrelevant regions and has the following two contributions. First, our model can pay attention only to the text-relevant region and manipulate the region aligned with the text description. Second, our model can achieve an appropriate balance between the generation of accurate attributes in the text-relevant region and the reconstruction in the text-irrelevant regions. Experimental results show that the proposed method can significantly improve the performance of image manipulation.
  • Human Emotion Recognition Using Multi-Modal Biological Signals Based On Time Lag-Considered Correlation Maximization.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 4683, 4687, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Distributed Label Dequantized Gaussian Process Latent Variable Model for Multi-View Data Integration.
    Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 4643, 4647, IEEE, 2022年
    英語, 研究論文(国際会議プロシーディングス), In this paper, we present a novel method for multi-view data analysis, distributed label dequantized Gaussian process latent variable model (DLDGP). DLDGP can integrate multi-view data and class information into a common latent space. In the previous multi-view methods, the dimension of label features transformed from the class information is much smaller than those of the other modalities, which causes a dimensionality-limitation problem in the latent space. DLDGP extends the dimension of the label features by a distributed label dequantization scheme. Additionally, DLDGP calculates correlation between different classes by encoding class information into distributed features. DLDGP can correctly capture the relationship between multi-view data and obtain the latent features with high expression ability. Experimental results show the effectiveness of our method by using the open dataset.
  • Variational Bayesian Graph Convolutional Network for Robust Collaborative Filtering.
    Nozomu Onodera, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICASSP, 3908, 3912, IEEE, 2022年
    研究論文(国際会議プロシーディングス)
  • Time-Lag Aware Latent Variable Model for Prediction of Important Scenes Using Baseball Videos and Tweets.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 22, 7, 2465, 2465, 2022年
    研究論文(学術雑誌)
  • Refining Graph Representation for Cross-Domain Recommendation Based on Edge Pruning in Latent Space.
    Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa 0001, Satoshi Asamizu, Miki Haseyama
    IEEE Access, 10, 12503, 12509, 2022年
    研究論文(学術雑誌)
  • Interactive Re-ranking via Object Entropy-Guided Question Answering for Cross-Modal Image Retrieval.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    ACM Trans. Multim. Comput. Commun. Appl., 18, 3, 68, 17, ASSOC COMPUTING MACHINERY, 2022年
    英語, 研究論文(学術雑誌), Cross-modal image-retrieval methods retrieve desired images from a query text by learning relationships between texts and images. Such a retrieval approach is one of the most effective ways of achieving the easiness of query preparation. Recent cross-modal image-retrieval methods are convenient and accurate when users input a query text that can be used to uniquely identify the desired image. However, in reality, users frequently input ambiguous query texts, and these ambiguous queries make it difficult to obtain desired images. To overcome these difficulties, in this study, we propose a novel interactive cross-modal image-retrieval method based on question answering. The proposed method analyzes candidate images and asks users questions to obtain information that can narrow down retrieval candidates. By only answering questions generated by the proposed method, users can reach their desired images, even when using an ambiguous query text. Experimental results show the proposed method's effectiveness.
  • Deterioration Level Estimation Based on Convolutional Neural Network Using Confidence-Aware Attention Mechanism for Infrastructure Inspection.
    Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    Sensors, 22, 1, 382, 382, 2022年
    研究論文(学術雑誌)
  • Domain Adaptive Cross-Modal Image Retrieval via Modality and Domain Translations
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E104A, 6, 866, 875, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2021年06月
    英語, 研究論文(学術雑誌), Various cross-modal retrieval methods that can retrieve images related to a query sentence without text annotations have been proposed. Although a high level of retrieval performance is achieved by these methods, they have been developed for a single domain retrieval setting. When retrieval candidate images come from various domains, the retrieval performance of these methods might be decreased. To deal with this problem, we propose a new domain adaptive cross-modal retrieval method. By translating a modality and domains of a query and candidate images, our method can retrieve desired images accurately in a different domain retrieval setting. Experimental results for clipart and painting datasets showed that the proposed method has better retrieval performance than that of other conventional and state-of-the-art methods.
  • Database-adaptive Re-ranking for Enhancing Cross-modal Image Retrieval.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    MM '21: ACM Multimedia Conference, 3816, 3825, ACM, 2021年
    研究論文(国際会議プロシーディングス)
  • Interpretable Representation Learning on Natural Image Datasets via Reconstruction in Visual-Semantic Embedding Space.
    Nao Nakagawa, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    2021 IEEE International Conference on Image Processing(ICIP), 2473, 2477, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Cross-Domain Recommendation Method Based On Multi-Layer Graph Analysis With Visual Information.
    Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa 0001, Satoshi Asamizu, Miki Haseyama
    ICIP, 2688, 2692, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Time-Lag Aware Multi-Modal Variational Autoencoder Using Baseball Videos And Tweets For Prediction Of Important Scenes.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 2678, 2682, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Segmentation-Aware Text-Guided Image Manipulation.
    Tomoki Haruyama, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 2433, 2437, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Few-Shot Personalized Saliency Prediction using Person Similarity based on Collaborative Multi-Output Gaussian Process Regression.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 1469, 1473, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Interest Level Estimation via Multi-Modal Gaussian Process Latent Variable Factorization.
    Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 1209, 1213, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Deep Metric Network Via Heterogeneous Semantics for Image Sentiment Analysis.
    Yun Liang 0014, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 1039, 1043, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Correlation-Aware Attention Branch Network Using Multi-Modal Data For Deterioration Level Estimation Of Infrastructures.
    Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    ICIP, 1014, 1018, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • User Background Information-Aware Music Recommendation with Reinforcement Learning-Based Knowledge Graph Exploration.
    Keigo Sakurai, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    IEEE International Conference on Consumer Electronics-Taiwan(ICCE-TW), 1, 2, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Degradation Level Estimation of Road Structures via Attention Branch Network with Text Data.
    Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    IEEE International Conference on Consumer Electronics-Taiwan(ICCE-TW), 1, 2, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Cross-view Self-supervised Learning via Momentum Statistics in Batch Normalization.
    Guang Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    IEEE International Conference on Consumer Electronics-Taiwan(ICCE-TW), 1, 2, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Triplet Self-Supervised Learning for Gastritis Detection with Scarce Annotations.
    Guang Li, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 787, 788, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Defense Against Image Captioning Attacks via A Robust and Stable Recurrent Neural Network.
    Jiahuan Zhang, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 785, 786, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Text-Guided Image Manipulation for Desired Region Using Referring Image Segmentation.
    Yuto Watanabe, Ren Togo, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 661, 662, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Captioning特徴を利用したグラフ畳み込みネットワークに基づくアニメイラストのマルチラベル画像分類に関する検討
    LAN Ziwen, 前田圭介, 小川貴弘, 長谷山美紀
    映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 273, 274, IEEE, 2021年
  • A Trial of Fine-grained Classification of Expert-novice Level Using Bio-signals While Inspecting Subway Tunnels.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 204, 205, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Listener Recommendation for Artist Based on Knowledge Graph and Reinforcement Learning.
    Keigo Sakurai, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 202, 203, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Movie Rating Estimation Based on Weakly Supervised Multi-modal Latent Variable Model.
    Koshi Watanabe, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 195, 196, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Detection of Off-screen Sound Based on Loss Function of Self-supervised Audio-visual Spatialization.
    Masaki Yoshida, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 193, 194, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Visual Sentiment Prediction Using Few-shot Learning via Distribution Relations of Visual Features.
    Yingrui Ye, Yuya Moroto, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 191, 192, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Multi-class Similar Scene Retrieval in Soccer Videos: A Scene Confusion Reduction Method Based on Combination of Long and Short Frame Sequences.
    Yaozong Gan, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 117, 118, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Sports Action Detection Based on Self-Supervised Feature Learning and Object Detection.
    Tsuyoshi Masuda, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 54, 55, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Analysis of Social Trends Related to COVID-19 Pandemic Utilizing Social Media Data.
    Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa 0001, Satoshi Asamizu, Miki Haseyama
    GCCE, 43, 44, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Estimating Imagined Images from Brain Activities via Visual Question Answering.
    Saya Takada, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 35, 36, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Action Classification from Egocentric Videos Using Reinforcement Learning-based Pose Estimation.
    Shunya Ohaga, Ren Togo, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 9, 10, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Graph Analysis-based Recommendation via Entity Embeddings Using Wikipedia.
    Nozomu Onodera, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    GCCE, 5, 6, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Reliable Estimation of Deterioration Levels via Late Fusion Using Multi-View Distress Images for Practical Inspection.
    Keisuke Maeda, Naoki Ogawa, Takahiro Ogawa 0001, Miki Haseyama
    Journal of Imaging, 7, 12, 273, 273, 2021年
    研究論文(学術雑誌)
  • Feature Integration Through Semi-Supervised Multimodal Gaussian Process Latent Variable Model With Pseudo-Labels for Interest Level Estimation.
    Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa 0001, Miki Haseyama
    IEEE Access, 9, 163843, 163850, 2021年
    研究論文(学術雑誌)
  • [Paper] Personalized Recommendation of Tumblr Posts Using Graph Convolutional Networks with Preference-aware Multimodal Features
    Kazuma Ohtomo, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, Masahiro Iwahashi
    ITE Transactions on Media Technology and Applications, 9, 1, 54, 61, Institute of Image Information and Television Engineers, 2021年
    研究論文(学術雑誌)
  • 光電容積脈波による連続血圧推定における血流の流量と抵抗指標を用いた精度向上方式の提案と評価
    川上健, 川上健, 川上健, 住友和弘, 菅野厚博, 小川貴弘, 南重信, 長谷山美紀
    電気学会論文誌 E, 141, 6, 2021年
  • User-selectable Event Summarization in Unedited Raw Soccer Video via Multimodal Bidirectional LSTM
    Tomoki Haruyama, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    ITE TRANSACTIONS ON MEDIA TECHNOLOGY AND APPLICATIONS, 9, 1, 42, 53, INST IMAGE INFORMATION & TELEVISION ENGINEERS, 2021年
    英語, 研究論文(学術雑誌), A new method that generates user-selectable event summaries from unedited raw soccer videos is presented in this paper. Since there are more unedited raw soccer videos than broadcasted/distributed soccer videos and unedited videos have various viewers, it is necessary to analyze these videos for meeting the demands of various viewers. The proposed method introduces a multimodal CNN-BiLSTM architecture for analyzing unedited raw soccer videos. This architecture extracts candidate scenes for event summarization from unedited soccer videos and classifies these scenes into typical events. Finally, our method generates user-selectable event summaries by simultaneously considering the importance of candidate scenes and the event classification results. Experimental results using real unedited raw soccer videos show the effectiveness of our method.
  • Cross-domain Recommendation Based on Multilayer Graph Analysis Using Subgraph Representation
    Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    INTERNATIONAL WORKSHOP ON ADVANCED IMAGING TECHNOLOGY (IWAIT) 2021, 11766, SPIE-INT SOC OPTICAL ENGINEERING, 2021年
    英語, 研究論文(国際会議プロシーディングス), This paper presents cross-domain recommendation based on multilayer graph analysis using subgraph representation. The proposed method constructs two graphs in source and target domains utilizing user-item embedding and trains link relationships between the users' embedding features on each above graph via graph convolutional networks considering subgraph representation. Thus, the proposed method can obtain features with high representation ability, and this is the main contribution of this paper. Then the proposed method can estimate the user's embedding features in the target domain from those in the source domain and recommend items to users by using the estimated features. Experiments on real-world e-commerce datasets verify the effectiveness of the proposed method.
  • Interest Estimation Method Based on 2D Pose Features on Security Camera
    Yuki Honma, Ren Togo, Maiku Abe, Takahiro Ogawa, Miki Haseyama
    INTERNATIONAL WORKSHOP ON ADVANCED IMAGING TECHNOLOGY (IWAIT) 2021, 11766, SPIE-INT SOC OPTICAL ENGINEERING, 2021年
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a customer interest estimation method using security camera to meet the demand of the retail industry. In the field of retail industry, it is considered that the understanding of customers' interests in the real store can be used for various marketing activities such as the product development and the layout of the store. Then, it is important to pay attention to customers' behavior in the real store. Their behavior is often recorded by the cameras installed in the store for security purposes. A method for estimating their interests from the videos of the security camera is presented in this paper. The novelty of our method is three-fold. Firstly, the experimental data of subjects in our group were taken by using the security camera already installed in the real store. Secondly, we used a pre-trained posture estimation model and treated the results as the features to be trained by a two-layer neural network model. Finally, a professional have annotated the subjects' interests. The effectiveness of our method was confirmed by comparing with benchmark supervised machine learning models.
  • Preliminary study of AI-assisted diagnosis using FDG-PET/CT for axillary lymph node metastasis in patients with breast cancer
    Zongyao Li, Kazuhiro Kitajima, Kenji Hirata, Ren Togo, Junki Takenaka, Yasuo Miyoshi, Kohsuke Kudo, Takahiro Ogawa, Miki Haseyama
    EJNMMI RESEARCH, 11, 1, SPRINGER, 2021年01月
    英語, 研究論文(学術雑誌), Background To improve the diagnostic accuracy of axillary lymph node (LN) metastasis in breast cancer patients using 2-[F-18]FDG-PET/CT, we constructed an artificial intelligence (AI)-assisted diagnosis system that uses deep-learning technologies. Materials and methods Two clinicians and the new AI system retrospectively analyzed and diagnosed 414 axillae of 407 patients with biopsy-proven breast cancer who had undergone 2-[F-18]FDG-PET/CT before a mastectomy or breast-conserving surgery with a sentinel lymph node (LN) biopsy and/or axillary LN dissection. We designed and trained a deep 3D convolutional neural network (CNN) as the AI model. The diagnoses from the clinicians were blended with the diagnoses from the AI model to improve the diagnostic accuracy. Results Although the AI model did not outperform the clinicians, the diagnostic accuracies of the clinicians were considerably improved by collaborating with the AI model: the two clinicians' sensitivities of 59.8% and 57.4% increased to 68.6% and 64.2%, respectively, whereas the clinicians' specificities of 99.0% and 99.5% remained unchanged. Conclusions It is expected that AI using deep-learning technologies will be useful in diagnosing axillary LN metastasis using 2-[F-18]FDG-PET/CT. Even if the diagnostic performance of AI is not better than that of clinicians, taking AI diagnoses into consideration may positively impact the overall diagnostic accuracy.
  • A Note on Detection of Sports Action Based on Temporal Cycle Consistency Learning
    Tsuyoshi Masuda, Ren Togo, Takahiro Ogawa, Miki Haseyama
    INTERNATIONAL WORKSHOP ON ADVANCED IMAGING TECHNOLOGY (IWAIT) 2021, 11766, SPIE-INT SOC OPTICAL ENGINEERING, 2021年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method for action detection based on Temporal Cycle Consistency(TCC) Learning. The proposed method realizes the action detection of flexible length segments based on a frame-level action prediction technique. We enable calculation of similarities for spatio-temporal features based on TCC to detect target actions from input videos. Finally, our method determines temporal segments by smoothing the frame-level action detection result. Experimental results show the validity of the proposed method.
  • Interior Coordination Image Retrieval with Object-Detection-Based and Color Features
    Ren Togo, Takahiro Ogawa, Miki Haseyama
    INTERNATIONAL WORKSHOP ON ADVANCED IMAGING TECHNOLOGY (IWAIT) 2021, 11766, SPIE-INT SOC OPTICAL ENGINEERING, 2021年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a new interior coordination image retrieval method using object-detection-based and color features. Interior coordination requires consideration of objects' positional information and the overall atmosphere of the room simultaneously. However, similar image retrieval methods considering the coordination characteristics have not been proposed. In the proposed method, we extract different types of features from interior coordination images and realize the similar interior coordination image retrieval based on our newly derived features.
  • Self-Supervised Learning for Gastritis Detection with Gastric X-Ray Images.
    Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    CoRR, abs/2104.02864, 2021年
    研究論文(学術雑誌)
  • Soft-Label Anonymous Gastric X-ray Image Distillation.
    Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    CoRR, abs/2104.02857, 305, 309, IEEE, 2021年
    研究論文(学術雑誌)
  • IR Questioner: QA-based Interactive Retrieval System.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    ICMR '21: International Conference on Multimedia Retrieval(ICMR), 611, 614, ACM, 2021年
    英語, 研究論文(国際会議プロシーディングス), Image retrieval from a given text query (text-to-image retrieval) is one of the most essential systems, and it is effectively utilized for databases (DBs) on the Web. To make them more versatile and familiar, a retrieval system that is adaptive even for personal DBs such as images in smartphones and lifelogging devices should be considered. In this paper, we present a novel text-to-image retrieval system that is specialized for personal DBs. With the cross-modal scheme and the question-answering scheme, the developed system enables users to obtain the desired image effectively even from personal DBs. Our demo is available at https://sites.google.com/view/ir-questioner/.
  • Human Emotion Estimation Using Multi-Modal Variational AutoEncoder with Time Changes.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2021 IEEE 3RD GLOBAL CONFERENCE ON LIFE SCIENCES AND TECHNOLOGIES (IEEE LIFETECH 2021), 67, 68, IEEE, 2021年
    英語, 研究論文(国際会議プロシーディングス), A human emotion estimation method via feature integration using multi-modal variational autoencoder (MVAE) with time changes is presented in this paper. To utilize multi-modal information such as gaze and brain activity data including some noises, the proposed method newly introduces MVAE into the human emotion estimation. Furthermore, the proposed MVAE can consider the changes in bio-signals with time and reduce the effect of noises caused in bio-signals by using the probabilistic variation. Experimental results with that of some state-of-the-art methods indicate that the proposed method is effective.
  • メタデータを考慮した楽曲グラフ探索に基づく強化学習を用いた楽曲プレイリスト生成に関する検討
    櫻井慶悟, 藤後廉, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 53, 54, IEEE, 2021年
    英語, Spreading of music streaming platforms that use playlists to make recommendations, automatic playlist generation has been actively researched. Recently, it has been reported that playlists that have high diversity and smooth track transitions increase user satisfaction. Our previous method that used a two-dimensional space as a reinforcement learning environment has achieved these demands, but there remains the problem that the content of multi-dimensional acoustic features cannot be retained accurately. To solve this problem, in this paper, we present a new method of music playlist generation based on reinforcement learning using a graph structure constructed from multi-dimensional acoustic features directly. The new playlist generation provides greater diversity and smoother track transitions than the previous method. Experimental results are shown for verifying the effectiveness of the proposal method.
  • Question Answering from Brain Activity Data via Decoder Based on Neural Networks.
    Saya Takada, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2021 IEEE 3RD GLOBAL CONFERENCE ON LIFE SCIENCES AND TECHNOLOGIES (IEEE LIFETECH 2021), 51, 52, IEEE, 2021年
    英語, 研究論文(国際会議プロシーディングス), We build a model that can estimate what subjects recognize from functional magnetic resonance imaging (fMRI) data via a visual question answering (VQA) model. The VQA model can generate an answer to a question about an image. We convert fMRI signals into image features via an fMRI decoder based on the relationship between the fMRI signals and the image features extracted from the gazed image. Then this allows the VQA model to answer a visual question from the fMRI signals measured while the subject is gazing at the image. Though brain decoding, which interprets what humans recognize, has become overwhelmingly popular in neuroscience, they often suffer from the small datasets of brain activity data. To overcome the small size of datasets of fMRI signals, we introduce an fMRI decoder based on neural networks that have a high expressive ability. Even when we do not have enough fMRI signals, the proposed method derives the answer to what a person is looking at from fMRI signals. Experimental results on several datasets show that our method allows us to answer a question about gazed images from fMRI signals.
  • Cross-Domain Semi-Supervised Deep Metric Learning for Image Sentiment Analysis.
    Yun Liang 0014, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 4150, 4154, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Feature Integration via Semi-Supervised Ordinally Multi-Modal Gaussian Process Latent Variable Model.
    Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 4130, 4134, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Multi-Modal Label Dequantized Gaussian Process Latent Variable Model for Ordinal Label Estimation.
    Masanao Matsumoto, Keisuke Maeda, Naoki Saito 0006, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 3985, 3989, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Semantic-Aware Unpaired Image-to-Image Translation for Urban Scene Images.
    Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 2150, 2154, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Classification of Expert-Novice Level Using Eye Tracking And Motion Data via Conditional Multimodal Variational Autoencoder.
    Yusuke Akamatsu, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 1360, 1364, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Estimation of Visual Features of Viewed Image From Individual and Shared Brain Information Based on FMRI Data Using Probabilistic Generative Model.
    Takaaki Higashi, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 1335, 1339, IEEE, 2021年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method for estimation of visual features based on brain responses measured when subjects view images. The proposed method estimates visual features of viewed images by using both individual and shared brain information from functional magnetic resonance imaging (fMRI) data when subjects view images. To extract an effective latent space shared by multiple subjects from high dimensional fMRI data, a probabilistic generative model that can provide a prior distribution to the space is introduced into the proposed method. Also, the extraction of a robust feature space with respect to noise for the individual information becomes feasible via the proposed probabilistic generative model. This is the first contribution of our method. Furthermore, the proposed method constructs a decoder transforming brain information into visual features based on collaborative use of both estimated spaces for individual and shared brain information. This is the second contribution of our method. Experimental results show that the proposed method improves the estimation accuracy of the visual features of viewed images.
  • Human-Centered Favorite Music Classification Using EEG-Based Individual Music Preference Via Deep Time-Series CCA.
    Ryosuke Sawata, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP), 1320, 1324, IEEE, 2021年
    研究論文(国際会議プロシーディングス)
  • Rubber Material Property Prediction Using Electron Microscope Images of Internal Structures Taken under Multiple Conditions.
    Ren Togo, Naoki Saito 0006, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    Sensors, 21, 6, 2088, 2088, MDPI, 2021年
    英語, 研究論文(学術雑誌), A method for prediction of properties of rubber materials utilizing electron microscope images of internal structures taken under multiple conditions is presented in this paper. Electron microscope images of rubber materials are taken under several conditions, and effective conditions for the prediction of properties are different for each rubber material. Novel approaches for the selection and integration of reliable prediction results are used in the proposed method. The proposed method enables selection of reliable results based on prediction intervals that can be derived by the predictors that are each constructed from electron microscope images taken under each condition. By monitoring the relationship between prediction results and prediction intervals derived from the corresponding predictors, it can be determined whether the target prediction results are reliable. Furthermore, the proposed method integrates the selected reliable results based on Dempster-Shafer (DS) evidence theory, and this integration result is regarded as a final prediction result. The DS evidence theory enables integration of multiple prediction results, even if the results are obtained from different imaging conditions. This means that integration can even be realized if electron microscope images of each material are taken under different conditions and even if these conditions are different for target materials. This nonconventional approach is suitable for our application, i.e., property prediction. Experiments on rubber material data showed that the evaluation index mean absolute percent error (MAPE) was under 10% by the proposed method. The performance of the proposed method outperformed conventional comparative property estimation methods. Consequently, the proposed method can realize accurate prediction of the properties with consideration of the characteristic of electron microscope images described above.
  • Detection of Important Scenes in Baseball Videos via a Time-Lag-Aware Multimodal Variational Autoencoder.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    Sensors, 21, 6, 2045, 2045, MDPI, 2021年
    英語, 研究論文(学術雑誌), A new method for the detection of important scenes in baseball videos via a time-lag-aware multimodal variational autoencoder (Tl-MVAE) is presented in this paper. Tl-MVAE estimates latent features calculated from tweet, video, and audio features extracted from tweets and videos. Then, important scenes are detected by estimating the probability of the scene being important from estimated latent features. It should be noted that there exist time-lags between tweets posted by users and videos. To consider the time-lags between tweet features and other features calculated from corresponding multiple previous events, the feature transformation based on feature correlation considering such time-lags is newly introduced to the encoder in MVAE in the proposed method. This is the biggest contribution of the Tl-MVAE. Experimental results obtained from actual baseball videos and their corresponding tweets show the effectiveness of the proposed method.
  • Deterioration level estimation via neural network maximizing category-based ordinally supervised multi-view canonical correlation.
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    Multim. Tools Appl., 80, 15, 23091, 23112, SPRINGER, 2021年
    英語, 研究論文(学術雑誌), A deterioration level estimation method via neural network maximizing category-based ordinally supervised multi-view canonical correlation is presented in this paper. This paper focuses on real world data such as industrial applications and has two contributions. First, a novel neural network handling multi-modal features transforms original features into features effectively representing deterioration levels in transmission towers, which are one of the infrastructures, with consideration of only correlation maximization. It can be realized by setting projection matrices maximizing correlations between multiple features into weights of hidden layers. That is, since the proposed network has only a few hidden layers, it can be trained from a small amount of training data. Second, since there exist diverse characteristics and an ordinal scale in deterioration levels, the proposed method newly derives category-based ordinally supervised multi-view canonical correlation analysis (Co-sMVCCA). Co-sMVCCA enables estimation of effective projection considering both within-class divergence and the ordinal scale between classes. Experimental results showed that the proposed method realizes accurate deterioration level estimation.
  • Disentangled Representation Learning in Real-World Image Datasets via Image Segmentation Prior.
    Nao Nakagawa, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 9, 110880, 110888, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2021年
    英語, 研究論文(学術雑誌), We propose a novel method that can learn easy-to-interpret latent representations in real-world image datasets using a VAE-based model by splitting an image into several disjoint regions. Our method performs object-wise disentanglement by exploiting image segmentation and alpha compositing. With remarkable results obtained by unsupervised disentanglement methods for toy datasets, recent studies have tackled challenging disentanglement for real-world image datasets. However, these methods involve deviations from the standard VAE architecture, which has favorable disentanglement properties. Thus, for disentanglement in images of real-world image datasets with preservation of the VAE backbone, we designed an encoder and a decoder that embed an image into disjoint sets of latent variables corresponding to objects. The encoder includes a pre-trained image segmentation network, which allows our model to focus only on representation learning while adopting image segmentation as an inductive bias. Evaluations using real-world image datasets, CelebA and Stanford Cars, showed that our method achieves improved disentanglement and transferability.
  • Detection of Important Scenes in Baseball Videos via Bidirectional Time Lag Aware Deep Multiset Canonical Correlation Analysis.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 9, 84971, 84981, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2021年
    英語, 研究論文(学術雑誌), A novel method for detection of important scenes in baseball videos based on correlation maximization between heterogeneous modalities via bidirectional time lag aware deep multiset canonical correlation analysis (BiTl-dMCCA) is presented in this paper. The proposed method enables detection of important scenes by collaboratively using baseball videos and their corresponding tweets. The technical contributions of this paper are twofold. First, since there are time lags between not only "tweets and corresponding multiple previous events" but also "events and corresponding multiple following posted tweets", the proposed method considers these bidirectional time lags. Specifically, the representation of such bidirectional time lags into the derivation of their covariance matrices is newly introduced. Second, the proposed method adopts textual, visual and audio features calculated from tweets and videos as multi-modal time series features. Important scenes are detected as abnormal scenes via anomaly detection based on a generative adversarial network using multi-modal features projected by BiTl-dMCCA. The proposed method does not need any training data with annotation. Experimental results obtained by applying the proposed method to actual baseball matches show the effectiveness of the proposed method.
  • Distress Image Retrieval for Infrastructure Maintenance via Self-Trained Deep Metric Learning Using Experts' Knowledge.
    Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 9, 65234, 65245, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2021年
    英語, 研究論文(学術雑誌), Distress image retrieval for infrastructure maintenance via self-trained deep metric learning using experts' knowledge is proposed in this paper. Since engineers take multiple images of a single distress part for inspection of road structures, it is necessary to construct a similar distress image retrieval method considering the input of multiple images to support determination of the level of deterioration. Thus, the construction of an image retrieval method while selecting an effective input from multiple images is described in this paper. The proposed method performs deep metric learning by using a small number of effective images labeled by experts' knowledge with information about their effectiveness and a large number of unlabeled images via a self-training approach. Specifically, an end-to-end learning approach that performs retraining of the model by assigning pseudo-labels to these unlabeled images according to the output confidence of the model is achieved. Thus, the proposed method can select an effective image from multiple images that are input at the retrieval as a query image. This is the main contribution of this paper. As a result, the proposed method realizes highly accurate retrieval of similar distress images considering the actual situation of inspection in which multiple images of a distress part are input.
  • Text-Guided Style Transfer-Based Image Manipulation Using Multimodal Generative Models.
    Ren Togo, Megumi Kotera, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 9, 64860, 64870, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2021年
    英語, 研究論文(学術雑誌), A new style transfer-based image manipulation framework combining generative networks and style transfer networks is presented in this paper. Unlike conventional style transfer tasks, we tackle a new task, text-guided image manipulation. We realize style transfer-based image manipulation that does not require any reference style images and generate a style image from the user's input sentence. In our method, since an initial reference input sentence for a content image can automatically be given by an image-to-text model, the user only needs to update the reference sentence. This scheme can help users when they do not have any images representing the desired style. Although this text-guided image manipulation is a new challenging task, quantitative and qualitative comparisons showed the superiority of our method.
  • Perceived Image Decoding From Brain Activity Using Shared Information of Multi-Subject fMRI Data.
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 9, 26593, 26606, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2021年
    英語, 研究論文(学術雑誌), Decoding a person's cognitive contents from evoked brain activity is becoming important in the field of brain-computer interaction. Previous studies have decoded a perceived image from functional magnetic resonance imaging (fMRI) activity by constructing brain decoding models that were trained with a single subject's fMRI data. However, accurate decoding is still challenging since fMRI data acquired from only a single subject have several disadvantageous characteristics such as small sample size, noisy nature, and high dimensionality. In this article, we propose a method to decode categories of perceived images from fMRI activity using shared information of multi-subject fMRI data. Specifically, by aggregating fMRI data of multiple subjects that contain a large number of samples, we extract a low-dimensional latent representation shared by multi-subject fMRI data. Then the latent representation is nonlinearly transformed into visual features and semantic features of the perceived images to identify categories from various candidate categories. Our approach leverages rich information obtained from multi-subject fMRI data and improves the decoding performance. Experimental results obtained by using two public fMRI datasets showed that the proposed method can more accurately decode categories of perceived images from fMRI activity than previous approaches using a single subject's fMRI data.
  • Supervised Fractional-Order Embedding Multiview Canonical Correlation Analysis via Ordinal Label Dequantization for Image Interest Estimation.
    Masanao Matsumoto, Naoki Saito 0006, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 9, 21810, 21822, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2021年
    英語, 研究論文(学術雑誌), Supervised fractional-order embedding multiview canonical correlation analysis via ordinal label dequantization (SFEMCCA-OLD) for image interest estimation is presented in this paper. SFEMCCA-OLD is a CCA method that realizes accurate integration of features including low-dimensional ordinal label features. In general, since information is lost due to a limitation of the number of classes, i.e., the dimension of ordinal label information is smaller than those of other features, derivation of highly accurate integration of features is difficult. In SFEMCCA-OLD, the dimension of the ordinal label information can be increased by estimation of the canonical correlation between multiview features. We call this approach ordinal label dequantization. In addition, by introducing a fractional-order technique, our method can calculate optimal projections for noisy data such as real data. Experimental results show that the accuracy of SFEMCCA-OLD for image interest estimation is better than that of recent CCA-based methods.
  • Chronic atrophic gastritis detection with a convolutional neural network considering stomach regions
    Misaki Kanai, Ren Togo, Takahiro Ogawa, Miki Haseyama
    WORLD JOURNAL OF GASTROENTEROLOGY, 26, 25, 3650, 3659, BAISHIDENG PUBLISHING GROUP INC, 2020年07月
    英語, 研究論文(学術雑誌), BACKGROUND The risk of gastric cancer increases in patients withHelicobacter pylori-associated chronic atrophic gastritis (CAG). X-ray examination can evaluate the condition of the stomach, and it can be used for gastric cancer mass screening. However, skilled doctors for interpretation of X-ray examination are decreasing due to the diverse of inspections. AIM To evaluate the effectiveness of stomach regions that are automatically estimated by a deep learning-based model for CAG detection. METHODS We used 815 gastric X-ray images (GXIs) obtained from 815 subjects. The ground truth of this study was the diagnostic results in X-ray and endoscopic examinations. For a part of GXIs for training, the stomach regions are manually annotated. A model for automatic estimation of the stomach regions is trained with the GXIs. For the rest of them, the stomach regions are automatically estimated. Finally, a model for automatic CAG detection is trained with all GXIs for training. RESULTS In the case that the stomach regions were manually annotated for only 10 GXIs and 30 GXIs, the harmonic mean of sensitivity and specificity of CAG detection were 0.955 +/- 0.002 and 0.963 +/- 0.004, respectively. CONCLUSION By estimating stomach regions automatically, our method contributes to the reduction of the workload of manual annotation and the accurate detection of the CAG.
  • 胃X線画像を用いたAIによるH.pylori感染識別と今後の展望               
    藤後 廉, 小川 貴弘, 間部 克裕, 加藤 元嗣, 長谷山 美紀
    日本消化器がん検診学会雑誌, 58, 2, 127, 127, (一社)日本消化器がん検診学会, 2020年03月
    日本語
  • Multimodal Important Scene Detection in Far-view Soccer Videos Based on Single Deep Neural Architecture
    Tomoki Haruyama, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    ITE TRANSACTIONS ON MEDIA TECHNOLOGY AND APPLICATIONS, 8, 2, 89, 99, INST IMAGE INFORMATION & TELEVISION ENGINEERS, 2020年
    英語, 研究論文(学術雑誌), The details of the matches of soccer can be estimated from visual and audio sequences, and they correspond to the occurrence of important scenes. Therefore, the use of these sequences is suitable for important scene detection. In this paper, a new multimodal method for important scene detection from visual and audio sequences in far-view soccer videos based on a single deep neural architecture is presented. A unique point of our method is that multiple classifiers can be realized by a single deep neural architecture that includes a Convolutional Neural Network-based feature extractor and a Support Vector Machine-based classifier. This approach provides a solution to the problem of not being able to simultaneously optimize different multiple deep neural architectures from a small amount of training data. Then we monitor confidence measures output from this architecture for the multimodal data and enable their integration to obtain the final classification result.
  • Important Scene Detection Based on Anomaly Detection using Long Short-Term Memory for Baseball Highlight Generation
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TAIWAN), 1, 2, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), This paper presents an important scene detection method based on anomaly detection using a Long Short-Term Memory (LSTM) for baseball highlight generation. In order to deal with multi-view time series features calculated from tweets and videos, we adopt an anomaly detection method using LSTM. LSTM which can maintain a long-term memory is effective for training such features. Introduction of LSTM into important scene detection of baseball videos is the biggest contribution of this paper. Experimental results show high detection performance by our method.
  • Interpretable Convolutional Neural Network Including Attribute Estimation for Image Classification
    Kazaha Horii, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    ITE TRANSACTIONS ON MEDIA TECHNOLOGY AND APPLICATIONS, 8, 2, 111, 124, INST IMAGE INFORMATION & TELEVISION ENGINEERS, 2020年
    英語, 研究論文(学術雑誌), An interpretable convolutional neural network (CNN) including attribute estimation for image classification is presented in this paper. Although CNNs perform highly accurate image classification, the reason for the classification results obtained by the neural networks is not clear. In order to provide interpretation of CNNs, the proposed method estimates attributes, which explain elements of objects, in an intermediate layer of the network. This enables improvement of the interpretability of CNNs, and it is the main contribution of this paper. Furthermore, the proposed method uses the estimated attributes for image classification in order to enhance its accuracy. Consequently, the proposed method not only provides interpretation of CNNs but also realizes improvement in the performance of image classification.
  • Image Retrieval Based on Supervised Local Regression and Global Alignment with Relevance Feedback for Insect Identification
    Keisuke Maeda, Susumu Genma, Takahiro Ogawa, Miki Haseyama
    ITE TRANSACTIONS ON MEDIA TECHNOLOGY AND APPLICATIONS, 8, 3, 140, 150, INST IMAGE INFORMATION & TELEVISION ENGINEERS, 2020年
    英語, 研究論文(学術雑誌), A method for image retrieval based on supervised local regression and global alignment (sLRGA) with relevance feedback for insect identification is presented in this paper. Based on the novel sLRGA, which is an extended version of LRGA, the proposed method estimates ranking scores for image retrieval in such a way that the neighborhood structure of a feature space of the database can be optimally preserved with consideration of class information. This is the main contribution of this paper. By measuring the relevance between all of the images and the query image in the database, sLRGA realizes accurate image retrieval. Furthermore, when positive/negative labels to retrieved images are given by users, the proposed method can improve image retrieval performance considering the query relevance information via use of both relevance feedback and sLRGA. This is the second contribution of this paper. Experimental results show the effectiveness of the proposed method.
  • Estimation of Person-Specific Visual Attention via Selection of Similar Persons
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TAIWAN), 1, 2, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method for estimation of person-specific visual attention based on estimated similar persons' visual attention. For improving the estimation performance of person-specific visual attention, the proposed method uses the dataset including the large number of images and corresponding gaze data of many persons not including the target person and trains an estimation model based on deep learning. By using the estimated visual attention of similar persons for the target image, the proposed method estimates the visual attention of the target person with the small amount of gaze data. Experimental results show that the proposed method is effective for estimation of person-specific visual attention.
  • A Method for Player Importance Prediction from Player Network Using Gaze Position Estimated by LSTM
    Genki Suzuki, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    ITE TRANSACTIONS ON MEDIA TECHNOLOGY AND APPLICATIONS, 8, 3, 151, 160, INST IMAGE INFORMATION & TELEVISION ENGINEERS, 2020年
    英語, 研究論文(学術雑誌), A novel method for player importance prediction from a player network using gaze positions estimated by Long Short-Term Memory (LSTM) in soccer videos is presented in this paper. By newly using an estimation model of gaze positions trained by gaze tracking data of experienced persons, it is expected that the importance of each player can be predicted. First, we generate a player network by utilizing the estimated gaze positions and first-arrival regions representing players' connections, e.g., passes between players. The gaze positions are estimated by LSTM that is newly trained from the gaze tracking data of experienced persons. Second, the proposed method predicts the importance of each player by applying the Hypertext Induced Topic Selection (HITS) algorithm to the constructed network. Consequently, prediction of the importance of each player based on soccer tactic knowledge of experienced persons can be realized without constantly obtaining gaze tracking data.
  • An Estimation Method of Candidate Region for Superimposing Information Based on Gaze Tracking Data in Soccer Videos
    Genki Suzuki, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TAIWAN), 1, 2, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), A novel method estimating candidate regions for superimposing information in soccer videos based on gaze tracking data is presented in this paper. The proposed method generates a likelihood map based on visual attention regions based on the gaze tracking data and detection results of objects such as players and soccer goals in soccer videos. Candidate regions for superimposing information are estimated by using the likelihood map. Experimental results show that the proposed method realizes effective candidate region estimation.
  • Image Retrieval with Data Augmentation of Sentence Labels Based on Paraphrasing
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - TAIWAN (ICCE-TAIWAN), 1, 2, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), Text-based image retrieval is a fundamental study in the field of information retrieval. Recent text-based image retrieval methods employ deep neural networks (here-inafter referred to as deep neural TBIR) to retrieve a desired image from a sentence query and achieve the state-of-the-art performance in TBIR. To improve the retrieval performance of the deep neural TBIR method further, it is essential to prepare diverse sentence labels in training data. However, it takes a lot of effort to prepare diverse sentence labels in training data. To address this problem, we propose a novel deep neural TBIR method with data augmentation of the sentence labels in training data. Experimental results show the effectiveness of the proposed method.
  • Interactive re-ranking for cross-modal retrieval based on object-wise question answering.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    MMAsia 2020: ACM Multimedia Asia(MMAsia), 37, 7, ACM, 2020年
    研究論文(国際会議プロシーディングス)
  • Similar scene retrieval in soccer videos with weak annotations by multimodal use of bidirectional LSTM.
    Tomoki Haruyama, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    MMAsia 2020: ACM Multimedia Asia(MMAsia), 27, 8, ACM, 2020年
    研究論文(国際会議プロシーディングス)
  • Quantitative Analysis of Engineer's Skill Using Wearable Sensor Data while Inspecting Highway Bridge.
    Genki Suzuki, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2nd IEEE Global Conference on Life Sciences and Technologies(LifeTech), 111, 112, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Estimating Viewed Images with Natural Language Question Answering from fMRI Data.
    Saya Takada, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2nd IEEE Global Conference on Life Sciences and Technologies(LifeTech), 99, 100, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Distress Level Classification of Road Infrastructures via CNN Generating Attention Map.
    Naoki Ogawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2nd IEEE Global Conference on Life Sciences and Technologies(LifeTech), 97, 98, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Interest Estimation for Images Using Eye Gaze-based Visual and Text Features via DLPCCA.
    Masanao Matsumoto, Naoki Saito 0006, Takahiro Ogawa, Miki Haseyama
    2nd IEEE Global Conference on Life Sciences and Technologies(LifeTech), 3, 4, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Mvgan Maximizing Time-Lag Aware Canonical Correlation for Baseball Highlight Generation.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO WORKSHOPS (ICMEW), 1, 6, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), This paper presents multi-view unsupervised generative adversarial network maximizing time-lag aware canonical correlation (MvGAN) for baseball highlight generation. MvGAN has the following two contributions. First, MvGAN utilizes textual, visual and audio features calculated from tweets and videos as multi-view features. MvGAN which adopts these multi-view features is the effective work for highlight generation of baseball videos. Second, since there is a temporal difference between posted tweets and the corresponding events, MvGAN introduces a novel feature embedding scheme considering a time-lag between textual features and other features. Specifically, the proposed method newly derives the timelag aware canonical correlation maximization of these multi-view features. This is the biggest contribution of this paper. Furthermore, since MvGAN is an unsupervised method for highlight generation, a large amount of training data with annotation is not needed. Thus, the proposed method has high applicability to the real world.
  • Generation of Viewed Image Captions From Human Brain Activity Via Unsupervised Text Latent Space.
    Saya Takada, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2521, 2525, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), Generation of human cognitive contents based on the analysis of functional magnetic resonance imaging (fMRI) data has been actively researched. Cognitive contents such as viewed images can be estimated by analyzing the relationship between fMRI data and semantic information of viewed images. In this paper, we propose a new method generating captions for viewed images from human brain activity via a novel robust regression scheme. Unlike conventional generation methods using image feature representations, the proposed method makes use of more semantic text feature representations, which are more suitable for the caption generation. We construct a text latent space with unlabeled images not used for the training, and the fMRI data are regressed to the text latent space. Besides, we newly make use of unlabeled images not used for the training phase to improve caption generation performance. Finally, the proposed method can generate captions from the fMRI data measured while subjects are viewing images. Experimental results show that the proposed method enables accurate caption generation for viewed images.
  • Multimodal Image-to-Image Translation for Generation of Gastritis Images.
    Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2466, 2470, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), We present a new multimodal image-to-image translation model for the generation of gastritis images using X-ray and blood inspection results. In clinical situations, clinicians estimate the prognosis of the target disease by considering multiple inspection results. Similarly, we take a multimodal approach in the task of gastric cancer risk prediction. Visual characteristics of the gastric X-ray image and blood index values are highly related in the evaluation of gastric cancer risk. If we can generate a prediction image from blood index values, it contributes to the clinicians' sophisticated and integrated diagnosis. Hence, we learn a model that can map non-gastritis images to gastritis images based on the blood index values. Although this is a challenging multimodal task in medical image analysis, experimental results showed the effectiveness of our model.
  • Image Retrieval With Lingual And Visual Paraphrasing Via Generative Models.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2431, 2435, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), A new approach that improves text-based image retrieval (hereinafter referred to as TBIR) performance is proposed in this paper. TBIR methods aim to retrieve a desired image related to a query text. Especially, recent TBIR methods allow us to retrieve images considering word relationships by using a sentence as a query. In these TBIR methods, it is necessary to uniquely identify a desired image from similar images using a single query sentence. However, the diverse expressive styles for a query sentence make it difficult to uniquely identify a desired image. In this paper, we propose a novel TBIR method with paraphrasing on multiple representation spaces. Specifically, by paraphrasing a query sentence on lingual and visual representation spaces, the proposed method can retrieve a desired image from various perspectives and then it can uniquely identify a desired image from similar images. Comprehensive experimental results show the effectiveness of the proposed method.
  • Variational Autoencoder Based Unsupervised Domain Adaptation For Semantic Segmentation.
    Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2426, 2430, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), Unsupervised domain adaptation, which transfers supervised knowledge from a labeled domain to an unlabeled domain, remains a tough problem in the field of computer vision, especially for semantic segmentation. Some methods inspired by adversarial learning and semi-supervised learning have been developed for unsupervised domain adaptation in semantic segmentation and achieved outstanding performances. In this paper, we propose a novel method for this task. Like adversarial learning-based methods using a discriminator to align the feature distributions from different domains, we employ a variational autoencoder to get to the same destination but in a non-adversarial manner. Since the two approaches are compatible, we also integrate an adversarial loss into our method. By further introducing pseudo labels, our method can achieve state-of-the-art performances on two benchmark adaptation scenarios, GTA5-to-CITYSCAPES and SYNTHIA-to-CITYSCAPES.
  • Important Scene Detection Of Baseball Videos Via Time-Lag Aware Deep Multiset Canonical Correlation Maximization.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 1236, 1240, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a new important scene detection method of baseball videos based on correlation maximization between heterogeneous modalities via time-lag aware deep multiset canonical correlation analysis (Tl-dMCCA). The technical contributions of this paper are twofold. First, textual, visual and audio features calculated from tweets and videos are adopted as multi-view time series features. Since Tl-dMCCA which utilizes these features includes the unsupervised embedding scheme via deep networks, the proposed method can flexibly express the relationship between heterogeneous features. Second, since there is the time-lag between posted tweets and the corresponding multiple previous events, Tl-dMCCA considers the time-lag relationships between them. Specifically, we newly introduce the representation of such time-lags into the derivation of their covariance matrices. By considering time-lags via Tl-dMCCA, the proposed method correctly detects important scenes.
  • Soft-Label Anonymous Gastric X-Ray Image Distillation.
    Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 305, 309, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a soft-label anonymous gastric X-ray image distillation method based on a gradient descent approach. The sharing of medical data is demanded to construct high-accuracy computer-aided diagnosis (CAD) systems. However, the large size of the medical dataset and privacy protection are remaining problems in medical data sharing, which hindered the research of CAD systems. The idea of our distillation method is to extract the valid information of the medical dataset and generate a tiny distilled dataset that has a different data distribution. Different from model distillation, our method aims to find the optimal distilled images, distilled labels and the optimized learning rate. Experimental results show that the proposed method can not only effectively compress the medical dataset but also anonymize medical images to protect the patient's private information. The proposed approach can improve the efficiency and security of medical data sharing.
  • Estimation Of Visual Contents Based On Question Answering From Human Brain Activity.
    Saya Takada, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 61, 65, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), We propose an estimation method for free-form Visual Question Answering (VQA) from human brain activity, brain decoding VQA. The task of VQA in the field of computer vision is generating an answer given an image and a question about its contents. The proposed method can realize answering arbitrary visual questions about images from brain activity measured by functional Magnetic Resonance Imaging (fMRI) while viewing the same images. We enable estimating various information from brain activity via a unique VQA model, which can realize a more detailed understanding of images and complex reasoning. In addition, we newly make use of un-labeled images not used in the training phase to improve the performance of the transformation, since fMRI datasets are generally small. The proposed method can answer a visual question from a little amount of fMRI data measured while subjects are viewing images.
  • Feature Integration Via Geometrical Supervised Multi-View Multi-Label Canonical Correlation For Incomplete Label Assignment.
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 46, 50, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), This paper presents feature integration via geometrical supervised multi-view multi-label canonical correlation analysis (GSM2CCA) for incomplete label assignment. The problem of incomplete labels is frequently encountered in the multi-label classification problem where the training labels are obtained via crowd-sourcing. In such a situation, consideration of only the label correlation, which is the basic approach, is not suitable for improvement of representation ability of features. For dealing with the incomplete label assignment, GSM2CCA constructs effective feature embedding space providing the discriminant ability by introducing both the multi-label correlation and feature similarity of the original feature space into its objective function. Since novel integrated features with high discriminant ability can be calculated by our GSM2CCA, performance improvement of multi-label classification with the incomplete label assignment is realized. The main contribution of this paper is the realization of the effective feature integration via the adoption of the combination use of label similarity and locality preserving projection of heterogeneous features for solving the problem of the incomplete label assignment. The effectiveness of GSM2CCA by applying GSM2CCA-based feature integration to heterogeneous features calculated from various convolutional neural network models is verified via experimental results.
  • Unsupervised Domain Adaptation for Semantic Segmentation with Symmetric Adaptation Consistency.
    Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 2263, 2267, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), Unsupervised domain adaptation, which leverages label information from other domains to solve tasks on a domain without any labels, can alleviate the problem of the scarcity of labels and expensive labeling costs faced by supervised semantic segmentation. In this paper, we utilize adversarial learning and semi-supervised learning simultaneously to solve the task of unsupervised domain adaptation in semantic segmentation. We propose a new approach that trains two segmentation models with the adversarial learning symmetrically and further introduces the consistency between the outputs of the two models into the semi-supervised learning to improve the accuracy of pseudo labels which significantly affect the final adaptation performance. We achieve state-of-the-art semantic segmentation performance on the GTA5-to-Cityscapes scenario, a widely used benchmark setting in unsupervised domain adaptation.
  • Multi-View Bayesian Generative Model for Multi-Subject FMRI Data on Brain Decoding of Viewed Image Categories.
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    2020 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1215, 1219, IEEE, 2020年
    英語, 研究論文(国際会議プロシーディングス), Brain decoding studies have demonstrated that viewed image categories can be estimated from human functional magnetic resonance imaging (fMRI) activity. However, there are still limitations with the estimation performance because of the characteristics of fMRI data and the employment of only one modality extracted from viewed images. In this paper, we propose a multi-view Bayesian generative model for multi-subject fMRI data to estimate viewed image categories from fMRI activity. The proposed method derives effective representations of fMRI activity by utilizing multi-subject fMRI data. In addition, we associate fMRI activity with multiple modalities, i:e:, visual features and semantic features extracted from viewed images. Experimental results show that the proposed method outperforms existing state-of-the-art methods of brain decoding.
  • Interest Level Estimation Based on Feature Integration Considering Distribution of Partially Paired User's Behavior, Videos and Posters.
    Kyohei Kamikawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 944, 945, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Music Playlist Generation Based on Reinforcement Learning Using Acoustic Feature Map.
    Keigo Sakurai, Ren Togo, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 942, 943, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Estimation of Images Matched with Audio-Induced Brain Activity via Modified DGCCA.
    Yun Liang 0014, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 940, 941, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Estimation of User-Specific Visual Attention Considering Individual Tendency toward Gazed Objects.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 745, 746, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Estimation of Viewed Images Using Individual and Shared Brain Responses.
    Takaaki Higashi, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 716, 717, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Cross-domain Recommendation via Multi-layer Graph Analysis Using User-item Embedding.
    Taisei Hirakawa, Keisuke Maeda, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 714, 715, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Question Answering for Estimation of Seen Image Contents from Multi-subject fMRI Responses.
    Saya Takada, Ren Togo, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 712, 713, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Face Synthesis via User Manipulation of Disentangled Latent Representation.
    Nao Nakagawa, Ren Togo, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 692, 693, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Complexity Evaluation of Medical Image Data for Classification Problem Based on Spectral Clustering.
    Guang Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 667, 669, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Important Scene Prediction of Baseball Videos Using Twitter and Video Analysis Based on LSTM.
    Kaito Hirasawa, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    9th IEEE Global Conference on Consumer Electronics(GCCE), 636, 637, IEEE, 2020年
    研究論文(国際会議プロシーディングス)
  • Brain Decoding of Viewed Image Categories via Semi-Supervised Multi-View Bayesian Generative Model.
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    IEEE Trans. Signal Process., 68, 5769, 5781, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2020年
    英語, 研究論文(学術雑誌), Brain decoding has shown that viewed image categories can be estimated from evoked functional magnetic resonance imaging (fMRI) activity. Recent studies attempted to estimate viewed image categories that were not used for training previously. Nevertheless, the estimation performance is limited since it is difficult to collect a large amount of fMRI data for training. This paper presents a method to accurately estimate viewed image categories not used for training via a semi-supervised multi-view Bayesian generative model. Our model focuses on the relationship between fMRI activity and multiple modalities, i.e., visual features extracted from viewed images and semantic features obtained from viewed image categories. Furthermore, in order to accurately estimate image categories not used for training, our semi-supervised framework incorporates visual and semantic features obtained from additional image categories in addition to image categories of training data. The estimation performance of the proposed model outperforms existing state-of-the-art models in the brain decoding field and achieves more than 95% identification accuracy. The results also have shown that the incorporation of additional image category information is remarkably effective when the number of training samples is small. Our semi-supervised framework is significant for the brain decoding field where brain activity patterns are insufficient but visual stimuli are sufficient.
  • Few-Shot Personalized Saliency Prediction Based on Adaptive Image Selection Considering Object and Visual Attention.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    Sensors, 20, 8, 2170, 2170, MDPI, 2020年
    英語, 研究論文(学術雑誌), A few-shot personalized saliency prediction based on adaptive image selection considering object and visual attention is presented in this paper. Since general methods predicting personalized saliency maps (PSMs) need a large number of training images, the establishment of a theory using a small number of training images is needed. To tackle this problem, although finding persons who have visual attention similar to that of a target person is effective, all persons have to commonly gaze at many images. Thus, it becomes difficult and unrealistic when considering their burden. On the other hand, this paper introduces a novel adaptive image selection (AIS) scheme that focuses on the relationship between human visual attention and objects in images. AIS focuses on both a diversity of objects in images and a variance of PSMs for the objects. Specifically, AIS selects images so that selected images have various kinds of objects to maintain their diversity. Moreover, AIS guarantees the high variance of PSMs for persons since it represents the regions that many persons commonly gaze at or do not gaze at. The proposed method enables selecting similar users from a small number of images by selecting images that have high diversities and variances. This is the technical contribution of this paper. Experimental results show the effectiveness of our personalized saliency prediction including the new image selection scheme.
  • Tensor-Based Emotional Category Classification via Visual Attention-Based Heterogeneous CNN Feature Fusion.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    Sensors, 20, 7, 2146, 2146, MDPI, 2020年
    英語, 研究論文(学術雑誌), The paper proposes a method of visual attention-based emotion classification through eye gaze analysis. Concretely, tensor-based emotional category classification via visual attention-based heterogeneous convolutional neural network (CNN) feature fusion is proposed. Based on the relationship between human emotions and changes in visual attention with time, the proposed method performs new gaze-based image representation that is suitable for reflecting the characteristics of the changes in visual attention with time. Furthermore, since emotions evoked in humans are closely related to objects in images, our method uses a CNN model to obtain CNN features that can represent their characteristics. For improving the representation ability to the emotional categories, we extract multiple CNN features from our novel gaze-based image representation and enable their fusion by constructing a novel tensor consisting of these CNN features. Thus, this tensor construction realizes the visual attention-based heterogeneous CNN feature fusion. This is the main contribution of this paper. Finally, by applying logistic tensor regression with general tensor discriminant analysis to the newly constructed tensor, the emotional category classification becomes feasible. Since experimental results show that the proposed method enables the emotional category classification with the F1-measure of approximately 0.6, and about 10% improvement can be realized compared to comparative methods including state-of-the-art methods, the effectiveness of the proposed method is verified.
  • Chronic gastritis classification using gastric X-ray images with a semi-supervised learning method based on tri-training.
    Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    Medical Biol. Eng. Comput., 58, 6, 1239, 1250, SPRINGER HEIDELBERG, 2020年
    英語, 研究論文(学術雑誌), High-quality annotations for medical images are always costly and scarce. Many applications of deep learning in the field of medical image analysis face the problem of insufficient annotated data. In this paper, we present a semi-supervised learning method for chronic gastritis classification using gastric X-ray images. The proposed semi-supervised learning method based on tri-training can leverage unannotated data to boost the performance that is achieved with a small amount of annotated data. We utilize a novel learning method named Between-Class learning (BC learning) that can considerably enhance the performance of our semi-supervised learning method. As a result, our method can effectively learn from unannotated data and achieve high diagnostic accuracy for chronic gastritis.
  • Multi-Task Convolutional Neural Network Leading to High Performance and Interpretability via Attribute Estimation.
    Keisuke Maeda, Kazaha Horii, Takahiro Ogawa, Miki Haseyama
    IEICE Trans. Fundam. Electron. Commun. Comput. Sci., 103-A, 12, 1609, 1612, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2020年
    英語, 研究論文(学術雑誌), A multi-task convolutional neural network leading to high performance and interpretability via attribute estimation is presented in this letter. Our method can provide interpretation of the classification results of CNNs by outputting attributes that explain elements of objects as a judgement reason of CNNs in the middle layer. Furthermore, the proposed network uses the estimated attributes for the following prediction of classes. Consequently, construction of a novel multi-task CNN with improvements in both of the interpretability and classification performance is realized.
  • Inpainting via Sparse Representation Based on a Phaseless Quality Metric.
    Takahiro Ogawa, Keisuke Maeda, Miki Haseyama
    IEICE Trans. Fundam. Electron. Commun. Comput. Sci., 103-A, 12, 1541, 1551, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2020年
    英語, 研究論文(学術雑誌), An inpainting method via sparse representation based on a new phaseless quality metric is presented in this paper. Since power spectra, phaseless features, of local regions within images enable more successful representation of their texture characteristics compared to their pixel values, a new quality metric based on these phaseless features is newly derived for image representation. Specifically, the proposed method enables spare representation of target signals, i.e., target patches, including missing intensities by monitoring errors converged by phase retrieval as the novel phaseless quality metric. This is the main contribution of our study. In this approach, the phase retrieval algorithm used in our method has the following two important roles: (1) derivation of the new quality metric that can be derived even for images including missing intensities and (2) conversion of phaseless features, i.e., power spectra, to pixel values, i.e., intensities. Therefore, the above novel approach solves the existing problem of not being able to use better features or better quality metrics for inpainting. Results of experiments showed that the proposed method using sparse representation based on the new phaseless quality metric outperforms previously reported methods that directly use pixel values for inpainting.
  • Heterogeneous-Graph-Based Video Search Reranking Using Topic Relevance.
    Soh Yoshida, Mitsuji Muneyasu, Takahiro Ogawa, Miki Haseyama
    IEICE Trans. Fundam. Electron. Commun. Comput. Sci., 103-A, 12, 1529, 1540, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2020年
    英語, 研究論文(学術雑誌), In this paper, we address the problem of analyzing topics, included in a social video group, to improve the retrieval performance of videos. Unlike previous methods that focused on an individual visual aspect of videos, the proposed method aims to leverage the "mutual reinforcement" of heterogeneous modalities such as tags and users associated with video on the Internet. To represent multiple types of relationships between each heterogeneous modality, the proposed method constructs three subgraphs: user-tag, video-video, and video-tag graphs. We combine the three types of graphs to obtain a heterogeneous graph. Then the extraction of latent features, i.e., topics, becomes feasible by applying graph-based soft clustering to the heterogeneous graph. By estimating the membership of each grouped cluster for each video, the proposed method defines a new video similarity measure. Since the understanding of video content is enhanced by exploiting latent features obtained from different types of data that complement each other, the performance of visual reranking is improved by the proposed method. Results of experiments on a video dataset that consists of YouTube-8M videos show the effectiveness of the proposed method, which achieves a 24.3% improvement in terms of the mean normalized discounted cumulative gain in a search ranking task compared with the baseline method.
  • Deep convolutional neural network-based anomaly detection for organ classification in gastric X-ray examination.
    Ren Togo, Haruna Watanabe, Takahiro Ogawa, Miki Haseyama
    Comput. Biol. Medicine, 123, 103903, 103903, PERGAMON-ELSEVIER SCIENCE LTD, 2020年
    英語, 研究論文(学術雑誌), Aim: The aim of this study was to determine whether our deep convolutional neural network-based anomaly detection model can distinguish differences in esophagus images and stomach images obtained from gastric X-ray examinations.Methods: A total of 6012 subjects were analyzed as our study subjects. Since the number of esophagus X-ray images is much smaller than the number of gastric X-ray images taken in X-ray examinations, we took an anomaly detection approach to realize the task of organ classification. We constructed a deep autoencoding gaussian mixture model (DAGMM) with a convolutional autoencoder architecture. The trained model can produce an anomaly score for a given test X-ray image. For comparison, the original DAGMM, AnoGAN, and a One-Class Support Vector Machine (OCSVM) that were trained with features obtained by a pre-trained Inception-v3 network were used.Results: Sensitivity, specificity, and the calculated harmonic mean of the proposed method were 0.956, 0.980, and 0.968, respectively. Those of the original DAGMM were 0.932, 0.883, and 0.907, respectively. Those of AnoGAN were 0.835, 0.833, and 0.834, respectively, and those of OCSVM were 0.932, 0.935, and 0.934, respectively. Experimental results showed the effectiveness of the proposed method for an organ classification task.Conclusion: Our deep convolutional neural network-based anomaly detection model has shown the potential for clinical use in organ classification.
  • Human-Centric Emotion Estimation Based on Correlation Maximization Considering Changes With Time in Visual Attention and Brain Activity.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 8, 203358, 203368, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2020年
    英語, 研究論文(学術雑誌), A human-centric emotion estimation method based on correlation maximization with consideration of changes with time in visual attention and brain activity when viewing images is proposed in this paper. Owing to the recent developments of many kinds of biological sensors, many researchers have focused on multimodal emotion estimation using both eye gaze data and brain activity data for improving the quality of emotion estimation. In this paper, a novel method that focuses on the following two points is introduced. First, in order to reduce the burden on users, we obtain brain activity data from users only in the training phase by using a projection matrix calculated by canonical correlation analysis (CCA) between gaze-based visual features and brain activity-based features. Next, for considering the changes with time in both visual attention and brain activity, we obtain novel features based on CCA-based projection in each time unit. In order to include these two points, the proposed method analyzes a fourth-order gaze and image tensor for which modes are pixel location, color channel and the changes with time in visual attention. Moreover, in each time unit, the proposed method performs CCA between gaze-based visual features and brain activity-based features to realize human-centric emotion estimation with a high level of accuracy. Experimental results show that accurate human emotion estimation is achieved by using our new human-centric image representation.
  • Estimation of Interest Levels From Behavior Features via Tensor Completion Including Adaptive Similar User Selection.
    Keisuke Maeda, Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 8, 126109, 126118, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2020年
    英語, 研究論文(学術雑誌), A method for estimating interest levels from behavior features via tensor completion including adaptive similar user selection is presented in this paper. The proposed method focuses on a tensor that is suitable for data containing multiple contexts and constructs a third-order tensor in which three modes are "products", "users" and "user behaviors and interest levels" for these products. By complementing this tensor, unknown interest level estimation of a product for a target user becomes feasible. For further improving the estimation performance, the proposed method adaptively selects similar users for the target user by focusing on converged estimation errors between estimated interest levels and known interest levels in the tensor completion. Furthermore, the proposed method can adaptively estimate the unknown interest from the similar users. This is the main contribution of this paper. Therefore, the influence of users having different interests is reduced, and accurate interest level estimation can be realized. In order to verify the effectiveness of the proposed method, we show experimental results obtained by estimating interest levels of users holding books.
  • Supervised Fractional-Order Embedding Geometrical Multi-View CCA (SFGMCCA) for Multiple Feature Integration.
    Keisuke Maeda, Yoshiki Ito, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 8, 114340, 114353, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2020年
    英語, 研究論文(学術雑誌), Techniques for integrating different types of multiple features effectively have been actively studied in recent years. Multiset canonical correlation analysis (MCCA), which maximizes the sum of pairwise correlations of inter-view (i.e., between different features), is one of the powerful methods for integrating different types of multiple features, and various MCCA-based methods have been proposed. This work focuses on a supervised MCCA variant in order to construct a novel effective feature integration framework. In this paper, we newly propose supervised fractional-order embedding geometrical multi-view CCA (SFGMCCA). This method constructs not only the correlation structure but also two types of geometrical structures of intra-view (i.e., within each feature) and inter-view simultaneously, thereby realizing more precise feature integration. This method also supports the integration of small sample and high-dimensional data by using the fractional-order technique. We conducted experiments using four types of image datasets, i.e., MNIST, COIL-20, ETH-80 and CIFAR-10. Furthermore, we also performed an fMRI dataset containing brain signals to verify the robustness. As a result, it was confirmed that accuracy improvements using SFGMCCA were statistically significant at the significance level of 0.05 compared to those using conventional representative MCCA-based methods.
  • Enhancing Cross-Modal Retrieval Based on Modality-Specific and Embedding Spaces.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 8, 96777, 96786, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2020年
    英語, 研究論文(学術雑誌), A new approach that drastically improves cross-modal retrieval performance in vision and language (hereinafter referred to as & x201C;vision and language retrieval & x201D;) is proposed in this paper. Vision and language retrieval takes data of one modality as a query to retrieve relevant data of another modality, and it enables flexible retrieval across different modalities. Most of the existing methods learn optimal embeddings of visual and lingual information to a single common representation space. However, we argue that the forced embedding optimization results in loss of key information for sentences and images. In this paper, we propose an effective utilization of representation spaces in a simple but robust vision and language retrieval method. The proposed method makes use of multiple individual representation spaces through text-to-image and image-to-text models. Experimental results showed that the proposed approach enhances the performance of existing methods that embed visual and lingual information to a single common representation space.
  • Context-Aware Network Analysis of Music Streaming Services for Popularity Estimation of Artists.
    Yui Matsumoto, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 8, 48673, 48685, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2020年, [査読有り]
    英語, 研究論文(学術雑誌), A novel trial for estimating popularity of artists in music streaming services (MSS) is presented in this paper. The main contribution of this paper is to improve extensibility for using multi-modal features to accurately analyze latent relationships between artists. In the proposed method, a novel framework to construct a network is derived by collaboratively using social metadata and multi-modal features via canonical correlation analysis. Different from conventional methods that do not use multi-modal features, the proposed method can construct a network that can capture social metadata and multi-modal features, i.e., a context-aware network. For effectively analyzing the context-aware network, a novel framework to realize popularity estimation of artists is developed based on network analysis. The proposed method enables effective utilization of the network structure by extracting node features via a node embedding algorithm. By constructing an estimator that can distinguish differences between the node features, the proposed method can archive accurate popularity estimation of artists. Experimental results using multiple real-world datasets that contain artists in various genres in Spotify, one of the largest MSS, are presented. Quantitative and qualitative evaluations show that our method is effective for both classifying and regressing the popularity.
  • Retrieval of similar scenes based on multimodal distance metric learning in soccer videos
    Tomoki Haruyama, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    MMSports 2019 - Proceedings of the 2nd International Workshop on Multimedia Content Analysis in Sports, co-located with MM 2019, 10, 15, ACM, 2019年10月15日, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 Association for Computing Machinery. This paper presents a new method for retrieval of similar scenes based on multimodal distance metric learning in far-view soccer videos that broadly capture soccer fields and are not edited. We extract visual features and audio features from soccer video clips, and we extract text features from text data corresponding to these soccer video clips. In addition, distance metric learning based on Laplacian Regularized Metric Learning is performed to calculate the distances for each kind of features. Finally, by determining the final rank by integrating these distances, we realize successful multimodal retrieval of similar scenes from query scenes of soccer video clips. Experimental results show the effectiveness of our retrieval method.
  • Semantic Shot Classification in Baseball Videos Based on Similarities of Visual Features
    K. Hirasawa, K. Maeda, T. Ogawa, M. Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 663, 664, IEEE, 2019年10月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Region-based Distress Classification of Road Infrastructures via CNN Without Region Annotation
    N. Ogawa, K. Maeda, T. Ogawa, M. Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 764, 765, IEEE, 2019年10月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Aesthetic style transfer through text-to-image synthesis and image-to-image translation
    Megumi Kotera, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 492, 493, IEEE, 2019年10月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Voice-input multimedia information retrieval system based on text-to-image GAN
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 943, 944, IEEE, 2019年10月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Estimation of drilling energy from tunnel cutting face image based on online learning
    Kentaro Yamamoto, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 77, 1, 794, 795, IEEE, 2019年10月, [査読有り]
    英語
  • Detection of distress region from subway tunnel images via U-net-based deep semantic segmentation
    An Wang, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 766, 767, IEEE, 2019年10月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Estimation of Emotion Labels via Tensor-Based Spatiotemporal Visual Attention Analysis
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    Proceedings - International Conference on Image Processing, ICIP, 2019-September, 4105, 4109, IEEE, 2019年09月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents emotion label estimation via tensor-based spatiotemporal visual attention analysis. It has been reported in the fields of psychology and neuroscience that human emotions are related to two elements, their visual attention change and objects included in a target image. Therefore, the proposed method focuses on the spatiotemporal change of visual attention of human gazing at objects in the target image and constructs two neural networks which enable the emotion label estimation considering both of the above two elements. Specifically, the proposed method newly constructs a fourth-order tensor, gaze and image tensor (GIT) whose modes correspond to the width, the height and the color channel of the target image and the time axis of visual attention which is used for representing the time change. Then the first network, which consists of general tensor discriminant analysis (GTDA) and extreme learning machine (ELM), estimates the emotion label from the fourth-order GIT with concerning their visual attention change. Furthermore, the second network, which consists of pre-trained convolutoinal neural network-based feature extraction, GTDA and ELM, enables the estimation from the second-order GIT including visual features obtained from objects focused at each time. Finally, the proposed method estimates emotion labels based on decision fusion of the outputs from the two networks. Experimental results show the effectiveness of the proposed method.
  • Scene Retrieval for Video Summarization Based on Text-to-Image gan
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    Proceedings - International Conference on Image Processing, ICIP, 2019-September, 1825, 1829, IEEE, 2019年09月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), © 2019 IEEE. We present a new scene retrieval method based on text-to-image Generative Adversarial Network (GAN) and its application to query-based video summarization. Text-to-image GAN is a deep learning method that can generate images from their corresponding sentences. In this paper, we reveal a characteristic that deep learning-based visual features extracted from images generated by text-to-image GAN include semantic information sufficiently. By utilizing the generated images as queries, the proposed method achieves higher scene retrieval performance than those of the stateof-the-art methods. In addition, we introduce a novel architecture that can consider order relationship of the input sentences to our method for realizing a target video summarization. Specifically, the proposed method generates multiple images thorough text-to-image GAN from multiple sentences summarizing target videos. Their summarized video can be obtained by performing the retrieval of corresponding scenes from the target videos according to the generated images with considering the order relationship. Experimental results show the effectiveness of the proposed method in the retrieval and summarization performance.
  • Gastritis Detection from Gastric X-Ray Images Via Fine-Tuning of Patch-Based Deep Convolutional Neural Network
    Misaki Kanai, Ren Togo, Takahiro Ogawa, Miki Haseyama
    Proceedings - International Conference on Image Processing, ICIP, 2019-September, 1371, 1375, IEEE, 2019年09月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method for gastritis detection from gastric X-ray images via fine-tuning techniques using a deep convolutional neural network (DCNN). DCNNs can learn parameters to capture high-dimensional features which express semantic contents of images by training on a large number of labeled images. However, lack of gastric X-ray images for training often occurs. To realize accurate detection with a small number of gastric X-ray images, the proposed method adopts fine-tuning techniques and newly introduces simple annotation of stomach regions to gastric X-ray images used for training. The proposed method fine-tunes a pre-trained DCNN with patches and three kinds of patch-level class labels considering not only the image-level ground truth ('gastritis'/'non-gastritis') but also the regions of a stomach since the outside of the stomach is not related to the image-level ground truth. In the test phase, by estimating the patch-level class labels with the fine-tuned DCNN, the proposed method enables the image-level class label estimation which excludes the effect of the unnecessary regions. Experimental results show the effectiveness of the proposed method.
  • Neural Network Maximizing Ordinally Supervised Multi-View Canonical Correlation for Deterioration Level Estimation
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    Proceedings - International Conference on Image Processing, ICIP, 2019-September, 919, 923, IEEE, 2019年09月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a neural network maximizing ordinally supervised multi-view canonical correlation for deterioration level estimation. The contributions of this paper are twofold. First, in order to calculate features representing deterioration levels on transmission towers, which is one of the infrastructures, a novel neural network handling multi-modal features is constructed from a small amount of training data. Specifically, in our method, effective transformation to features with high discriminant ability without using many hidden layers is realized by setting projection matrices maximizing correlation between multiple features into hidden layer's weights. Second, since there exists ordinal scale in deterioration levels, the proposed method newly derives ordinally supervised multi-view canonical correlation analysis (OsMVCCA). OsMVCCA enables estimation of the effective projection considering not only label information but also their ordinal scales. Experimental results show that the proposed method realizes accurate deterioration level estimation.
  • Convolutional sparse coding-based deep random vector functional link network for distress classification of road structures.
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    Comp.-Aided Civil and Infrastruct. Engineering, 34, 8, 654, 676, WILEY, 2019年08月, [査読有り]
    英語, 研究論文(学術雑誌), © 2019 Computer-Aided Civil and Infrastructure Engineering This paper presents a convolutional sparse coding (CSC)-based deep random vector functional link network (CSDRN) for distress classification of road structures. The main contribution of this paper is the introduction of CSC into a feature extraction scheme in the distress classification. CSC can extract visual features representing characteristics of target images because it can successfully estimate optimal convolutional dictionary filters and sparse features as visual features by training from a small number of distress images. The optimal dictionaries trained from distress images have basic components of visual characteristics such as edge and line information of distress images. Furthermore, sparse feature maps estimated on the basis of the dictionaries represent both strength of the basic components and location information of regions having their components, and these maps can represent distress images. That is, sparse feature maps can extract key components from distress images that have diverse visual characteristics. Therefore, CSC-based feature extraction is effective for training from a limited number of distress images that have diverse visual characteristics. The construction of a novel neural network, CSDRN, by the use of a combination of CSC-based feature extraction and the DRN classifier, which can also be trained from a small dataset, is shown in this paper. Accurate distress classification is realized via the CSDRN.
  • Bilingual Lexicon Learning Using Tagged Images via Graph Trilateral Filter-based Feature Refinement
    Yui Matsumoto, Shota Hamano, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    2019 IEEE International Conference on Consumer Electronics - Taiwan, ICCE-TW 2019, 2019年05月
    研究論文(国際会議プロシーディングス), A novel method to realize bilingual lexicon learning (BLL) using tagged images is presented in this paper. Different from existing methods that require parallel corpora, the proposed method enables extraction of semantically similar words by utilizing not such corpora but tagged images on image sharing services. The main contribution of this paper is derivation of a novel framework to refine visual features of tagged images based on graph trilateral filter-based smoothing. This enables reduction of the influence of noisy tags that are irrelevant to contents of images. As a result, accurate BLL becomes feasible by nearest neighbor search using the refined visual features.
  • Convolutional Sparse Coding-based Anomalous Event Detection in Surveillance Videos
    Masanao Matsumoto, Naoki Saito, Takahiro Ogawa, Miki Haseyama
    2019 IEEE International Conference on Consumer Electronics - Taiwan (ICCE-TW), IEEE, 2019年05月
    研究論文(国際会議プロシーディングス)
  • User-Specific Visual Attention Estimation Based on Visual Similarity and Spatial Information in Images               
    Y. Moroto, K. Maeda, T. Ogawa, M. Haseyama
    IEEE International Conference on Consumer Electronics – Taiwan (ICCE-TW), 479, 480, 2019年05月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Estimating Viewed Image Categories from Human Brain Activity via Semi-supervised Fuzzy Discriminative Canonical Correlation Analysis.
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2019, Brighton, United Kingdom, May 12-17, 2019, 2019-May, 1105, 1109, IEEE, 2019年05月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method to estimate viewed image categories from human brain activity via newly derived semi-supervised fuzzy discriminative canonical correlation analysis (Semi-FDCCA). The proposed method can estimate image categories from functional magnetic resonance imaging (fMRI) activity measured while subjects view images by making fMRI activity and visual features obtained from images comparable through Semi-FDCCA. To realize Semi-FDCCA, we first derive a new supervised CCA called FDCCA that can consider fuzzy class information based on image category similarities obtained from WordNet ontology. Second, we adopt SemiCCA that can utilize additional unpaired visual features in addition to pairs of fMRI activity and visual features in order to prevent overfitting to the limited pairs. Furthermore, Semi-FDCCA can be derived by combining FDCCA with SemiCCA. Experimental results show that Semi-FDCCA enables accurate estimation of viewed image categories.
  • Extraction of regions related to cardiac sarcoidosis in polar map images
    Ren Togo, Takahiro Ogawa, Osamu Manabe, Kenji Hirata, Tohru Shiga, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 237, 238, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method for extracting important regions for deep learning models in the identification of cardiac sarcoidosis using polar map images. Although deep learning-based detection methods have widely studied, they are still often called black boxes. Since high reliability for provided results from computer-aided diagnosis systems is important toward clinical applications, this problem should be solved. In this paper, we try to visualize important regions for deep learning-based models for improvement of understanding to clinicians. We monitor the variance of confidence of a model constructed with a deep learning-based feature and define it as a contribution value toward the estimated label. We visualize important regions for models based on the contribution value.
  • Estimation of emotions evoked by images based on multiple gaze-based CNN features
    Taiga Matsui, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 194, 195, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method for estimating emotions evoked by watching images based on multiple visual features considering relationship with gaze information. The proposed method obtains multiple visual features from multiple middle layers of a Convolutional Neural Network. Then the proposed method newly derives their gaze-based visual features maximizing correlation with gaze information by using Discriminative Locality Preserving Canonical Correlation Analysis. The final estimation result is calculated by integrating multiple estimation results obtained from these gaze-based visual features. Consequently, successful emotion estimation becomes feasible by using such multiple estimation results which correspond to different semantic levels of target images.
  • Estimation of users' interest levels using tensor completion with SemiCCA
    Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 239, 240, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a new method for estimation of users' interest levels using tensor completion with SemiCCA. The proposed method extracts new features maximizing correlation between features calculated from partially paired users' behavior and contents with semi-supervised canonical correlation analysis (SemiCCA). By this approach, we can successfully use the contents that users have not viewed for the interest level estimation. Moreover, our method utilizes the tensor completion to estimate unknown interest levels. Consequently, in the proposed method, accurate estimation of interest levels using SemiCCA and the tensor completion is realized. Experimental results are shown to verify the effectiveness of the proposed method by using actual data.
  • Classification of subcellular protein patterns in human cells with transfer learning
    Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 273, 274, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. In this paper, we present a deep learning method for classifying subcellular protein patterns in human cells. Our method is mainly based on transfer learning and utilizes a newly proposed loss function named focal loss to deal with the problem of severe class imbalance existing in the task. The performance of our method is evaluated by a MacroF1 score of total 28 classes, and the final MacroF1 score of our method is 0.706.
  • Estimation of visual attention via canonical correlation between visual and gaze-based features
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 229, 230, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method for estimating visual attention via canonical correlation between visual and gaze-based features. The proposed method estimates user-specific visual attention by comparing a test image with training images including their corresponding individual eye gaze data in a common space. Specifically, canonical correlation analysis can derive projections which enable comparison between visual and gaze-based features in the common space. Therefore, given the new test image, our method projects its visual features to the common space and can estimate visual attention. Experimental results show the effectiveness of the proposed method.
  • Chronic gastritis detection from gastric X-ray images via deep autoencoding Gaussian mixture models
    Masanao Matsumoto, Naoki Saito, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 231, 232, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a detection method of chronic gastritis from gastric X-ray images. The conventional method cannot detect chronic gastritis accurately since the number of non-gastritis images is overwhelmingly larger than the number of gastritis images. To deal with this problem, the proposed method performs the detection of chronic gastritis by using Deep Autoencoding Gaussian Mixture Models (DAGMM) which is an anomaly detection approach. DAGMM enables construction of chronic gastritis detection model using only non-gastritis images. In addition, DAGMM is superior to conventional anomaly detection methods since the models of dimensionality reduction and density estimation can be learned simultaneously. Therefore, the proposed method realizes accurate detection of chronic gastritis by utilizing DAGMM.
  • Fine-tuning of pre-trained DCNN for gastritis detection from gastric X-ray images
    Misaki Kanai, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 196, 197, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a detection method of gastritis from gastric X-ray images using fine-tuning techniques. With the development of deep convolutional neural networks (DCNNs), DCNN-based methods have achieved more accurate performance than conventional machine learning methods using hand-crafted features in the field of medical image analysis. However, lack of training images often occurs in clinical situations even though DCNNs require a large amount of training images to avoid overfitting. Therefore, the proposed method aims to consider the clinical situations that a limited amount of the training images are available. By fine-tuning a DCNN pre-trained with a large amount of annotated natural images, we avoid overfitting and realize accurate detection of the gastritis with a small amount of the training images.
  • Bone metastatic tumor detection based on AnoGAN using CT images
    Haruna Watanabe, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 235, 236, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. In this paper, we propose a method to detect bone metastatic tumors using computed tomography (CT) images. Bone metastatic tumors spread from primary cancer to other organs, and they can cause severe pain. Therefore, it is important to detect metastatic tumors earlier in addition to primary cancer. However, since metastatic tumors are very small, and they emerge from unpredictable regions in the body, collecting metastatic tumor images is difficult compared to primary cancer. In such a case, it can be considered that the idea of anomaly detection is suitable. The proposed method based on a generative adversarial network model trains with only non-metastatic bone tumor images and detects bone metastatic tumor in an unsupervised manner. Then the anomaly score is defined for each test CT image. Experimental results show the anomaly scores between non-metastatic bone tumor images and metastatic bone tumor images are clearly different. The anomaly detection approach may be effective for the detection of bone metastatic tumors in CT images.
  • Semi-supervised discriminative CCA for estimating viewed image categories from fMRI data
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 233, 234, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method that estimates viewed image categories from functional magnetic resonance imaging (fMRI) data via semi-supervised discriminative canonical correlation analysis (Semi-DCCA). We newly derive Semi-DCCA that enables direct comparison of fMRI data and visual features extracted from viewed images while taking into account the class information and additional visual features to avoid overfitting. The proposed method enables estimation of image categories from fMRI data measured when subjects view images by comparing fMRI data with visual features through Semi-DCCA. Experimental results show that Semi-DCCA can improve estimation performance of the viewed image categories.
  • Video classification based on user preferences with soft-bag multiple instance learning
    Akira Toyoda, Takahiro Ogawa, Miki Haseyama
    2019 IEEE 1st Global Conference on Life Sciences and Technologies, LifeTech 2019, 198, 199, IEEE, 2019年03月, [査読有り]
    研究論文(国際会議プロシーディングス), © 2019 IEEE. This paper presents a method to classify videos based on user preferences with soft-bag multiple instance learning (MIL). Our method classifies videos that a user has watched into two classes (preferred and not-preferred) with two-modal features extracted from the videos and brain signals measured while the user is watching the videos. Our method splits videos and brain signals into fixed-length segments and computes features used for classification from only a fixed-number of segments selected based on the idea of soft-bag MIL. By using the features computed from the selected segments, our method makes it possible to classify videos in the case that some videos that a user prefers contain some scenes the user does not prefer, and vice versa. Our main contribution allows methods classifying videos based on user preferences to treat such a case unlike conventional methods.
  • The Friction Properties of Firebrat Scales
    Yuji Hirai, Naoto Okuda, Naoki Saito, Takahiro Ogawa, Ryuichiro Machida, Shuhei Nomura, Masahiro Ohara, Miki Haseyama, Masatsugu Shimomura
    BIOMIMETICS, 4, 1, MDPI, 2019年01月
    英語, 研究論文(学術雑誌), Friction is an important subject for sustainability due to problems that are associated with energy loss. In recent years, micro- and nanostructured surfaces have attracted much attention to reduce friction; however, suitable structures are still under consideration. Many functional surfaces are present in nature, such as the friction reduction surfaces of snake skins. In this study, we focused on firebrats, Thermobia domestica, which temporary live in narrow spaces, such as piled papers, so their body surface (integument) is frequently in contact with surrounding substrates. We speculate that, in addition to optical, cleaning effects, protection against desiccation and enemies, their body surface may be also adapted to reduce friction. To investigate the functional effects of the firebrat scales, firebrat surfaces were observed using a field-emission scanning electron microscope (FE-SEM) and a colloidal probe atomic force microscope (AFM). Results of surface observations by FE-SEM revealed that adult firebrats are entirely covered with scales, whose surfaces have microgroove structures. Scale groove wavelengths around the firebrat's head are almost uniform within a scale but they vary between scales. At the level of single scales, AFM friction force measurements revealed that the firebrat scale reduces friction by decreasing the contact area between scales and a colloidal probe. The heterogeneity of the scales' groove wavelengths suggests that it is difficult to fix the whole body on critical rough surfaces and may result in a "fail-safe" mechanism.
  • Multimodal Retrieval of Similar Soccer Videos Based on Optimal Combination of Multiple Distance Measures.
    Tomoki Haruyama, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    IEEE 8th Global Conference on Consumer Electronics(GCCE), 665, 666, IEEE, 2019年
    研究論文(国際会議プロシーディングス)
  • Similarity Calculation Based on Pass Regions in Soccer Videos.
    Sho Takahashi, Marco Bertini, Alberto Del Bimbo, Miki Haseyama, Toru Hagiwara
    IEEE 8th Global Conference on Consumer Electronics(GCCE), 515, 516, IEEE, 2019年
    研究論文(国際会議プロシーディングス)
  • Interest Estimation for Images Based on Eye Gaze-based Visual and Text Features.
    Masanao Matsumoto, Naoki Saito 0006, Takahiro Ogawa, Miki Haseyama
    IEEE 8th Global Conference on Consumer Electronics(GCCE), 481, 482, IEEE, 2019年
    研究論文(国際会議プロシーディングス)
  • Performance Prediction Method of Examinees Based on Matrix Completion.
    Yutaka Yamada, Takahiro Ogawa, Miki Haseyama
    IEEE 8th Global Conference on Consumer Electronics(GCCE), 229, 230, IEEE, 2019年, [査読有り]
    研究論文(国際会議プロシーディングス)
  • Estimating Viewed Image Categories from fMRI Activity via Multi-view Bayesian Generative Model.
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    IEEE 8th Global Conference on Consumer Electronics(GCCE), 127, 128, IEEE, 2019年, [査読有り]
    研究論文(国際会議プロシーディングス)
  • The Extraction of Individual Music Preference Based on Deep Time-series CCA.
    Ryosuke Sawata, Takahiro Ogawa, Miki Haseyama
    IEEE 8th Global Conference on Consumer Electronics(GCCE), 15, 16, IEEE, 2019年, [査読有り]
    研究論文(国際会議プロシーディングス)
  • Estimation of User-Specific Visual Attention Based on Gaze Information of Similar Users.
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 477, 478, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Effectiveness Evaluation of Deep Features for Image Reconstruction from fMRI Signals.
    Saya Takada, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 479, 480, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Scene Retrieval Using Text-to-image GAN-based Visual Similarities and Image-to-text Model-based Textual Similarities.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Global Conference on Consumer Electronics (GCCE), 13, 14, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Query is GAN: Scene Retrieval with Attentional Text-To-Image Generative Adversarial Network
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 7, 153183, 153193, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), © 2013 IEEE. Scene retrieval from input descriptions has been one of the most important applications with the increasing number of videos on the Web. However, this is still a challenging task since semantic gaps between features of texts and videos exist. In this paper, we try to solve this problem by utilizing a text-To-image Generative Adversarial Network (GAN), which has become one of the most attractive research topics in recent years. The text-To-image GAN is a deep learning model that can generate images from their corresponding descriptions. We propose a new retrieval framework, 'Query is GAN', based on the text-To-image GAN that drastically improves scene retrieval performance by simple procedures. Our novel idea makes use of images generated by the text-To-image GAN as queries for the scene retrieval task. In addition, unlike many studies on text-To-image GANs that mainly focused on the generation of high-quality images, we reveal that the generated images have reasonable visual features suitable for the queries even though they are not visually pleasant. We show the effectiveness of the proposed framework through experimental evaluation in which scene retrieval is performed from real video datasets.
  • Synthetic Gastritis Image Generation via Loss Function-Based Conditional PGGAN.
    Array,Array,Miki Haseyama
    IEEE Access, 7, 87448, 87457, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), © 2013 IEEE. In this paper, a novel synthetic gastritis image generation method based on a generative adversarial network (GAN) model is presented. Sharing medical image data is a crucial issue for realizing diagnostic supporting systems. However, it is still difficult for researchers to obtain medical image data since the data include individual information. Recently proposed GAN models can learn the distribution of training images without seeing real image data, and individual information can be completely anonymized by generated images. If generated images can be used as training images in medical image classification, promoting medical image analysis will become feasible. In this paper, we targeted gastritis, which is a risk factor for gastric cancer and can be diagnosed by gastric X-ray images. Instead of collecting a large amount of gastric X-ray image data, an image generation approach was adopted in our method. We newly propose loss function-based conditional progressive growing generative adversarial network (LC-PGGAN), a gastritis image generation method that can be used for a gastritis classification problem. The LC-PGGAN gradually learns the characteristics of gastritis in gastric X-ray images by adding new layers during the training step. Moreover, the LC-PGGAN employs loss function-based conditional adversarial learning so that generated images can be used as the gastritis classification task. We show that images generated by the LC-PGGAN are effective for gastritis classification using gastric X-ray images and have clinical characteristics of the target symptom.
  • Semi-Supervised Learning Based on Tri-Training for Gastritis Classification using Gastric X-ray Images.
    Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE International Symposium on Circuits and Systems, ISCAS 2019, Sapporo, Japan, May 26-29, 2019, 1, 5, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method of semi-supervised learning based on tri-training for gastritis classification using gastric X-ray images. The proposed method is constructed based on the tri-training architecture, and the strategies of label smoothing regularization and random erasing augmentation are utilized in the method to enhance the performance. Although the task of gastritis classification is challenging, we report that the proposed semi-supervised learning method using only a small number of labeled data achieves 0.888 harmonic mean of sensitivity and specificity on test data composed of 615 patients.
  • Synthetic Image Generation for Gastritis Detection Based on Auxiliary Classifier Generative Adversarial Network.
    Misaki Kanai, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE International Symposium on Circuits and Systems, ISCAS 2019, Sapporo, Japan, May 26-29, 2019, 1, 5, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), With the development of convolutional neural networks (CNNs), CNN-based methods for medical image analysis have achieved more accurate performance than conventional machine learning methods using hand-crafted features. Although these methods utilize a large number of training images and realize high performance, lack of the training images often occurs in medical image analysis due to several reasons. This paper presents a novel image generation method to construct a dataset for gastritis detection from gastric X-ray images. The proposed method effectively utilizes two kinds of training images (gastritis and non-gastritis images) to generate images of each domain by introducing label conditioning into a generative model. Experimental results using real-world gastric X-ray images show the effectiveness of the proposed method.
  • Text-to-Image GAN-Based Scene Retrieval and Re-Ranking Considering Word Importance.
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 7, 169920, 169930, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, we propose a novel scene retrieval and re-ranking method based on a text-to-image Generative Adversarial Network (GAN). The proposed method generates an image from an input query sentence based on the text-to-image GAN and then retrieves a scene that is the most similar to the generated image. By utilizing the image generated from the input query sentence as a query, we can control semantic information of the query image at the text level. Furthermore, we introduce a novel interactive re-ranking scheme to our retrieval method. Specifically, users can consider the importance of each word within the first input query sentence. Then the proposed method re-generates the query image that reflects the word importance provided by users. By updating the generated query image based on the word importance, it becomes feasible for users to revise retrieval results through this re-ranking process. In experiments, we showed that our retrieval method including the re-ranking scheme outperforms recently proposed retrieval methods.
  • Estimating Regions of Deterioration in Electron Microscope Images of Rubber Materials via a Transfer Learning-Based Anomaly Detection Model.
    Ren Togo, Naoki Saito 0006, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 7, 162395, 162404, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), A method for estimating regions of deterioration in electron microscope images of rubber materials is presented in this paper. Deterioration of rubber materials is caused by molecular cleavage, external force, and heat. An understanding of these characteristics is essential in the field of material science for the development of durable rubber materials. Rubber material deterioration can be observed by using on electron microscope but it requires much effort and specialized knowledge to find regions of deterioration. In this paper, we propose an automated deterioration region estimation method based on deep learning and anomaly detection techniques to support such material development. Our anomaly detection model, called Transfer Learning-based Deep Autoencoding Gaussian Mixture Model (TL-DAGMM), uses only normal regions for training since obtaining training data for regions of deterioration is difficult. TL-DAGMM makes use of extracted high representation features from a pre-trained deep learning model and can automatically learn the characteristics of normal rubber material regions. Regions of deterioration are estimated at the pixel level by calculated anomaly scores. Experiments on real rubber material electron microscope images demonstrated the effectiveness of our model.
  • Multi-feature Fusion Based on Supervised Multi-view Multi-label Canonical Correlation Projection.
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    IEEE International Conference on Acoustics, Speech and Signal Processing, ICASSP 2019, Brighton, United Kingdom, May 12-17, 2019, 3936, 3940, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents multi-feature fusion based on supervised multi view multi-label canonical correlation projection (sM2CP). The proposed method applies sM2CP-based feature fusion to multiple features obtained from various convolutional neural networks (CNNs) whose characteristics are different. Since new fused features with high representation ability can be obtained, performance improvement of multi-label classification is realized. Specifically, in order to tackle the multi-label problem, sM2CP introduces a label similarity information of label vectors into the objective function of supervised multi-view canonical correlation analysis. Thus, sM2CP can deal with complex label information such as multi-label annotation. The main contribution of this paper is the realization of feature fusion of multiple CNN features for the multi-label problem by introducing multi-label similarity information into the canonical correlation analysis-based feature fusion approach. Experimental results show the effectiveness of sM2CP, which enables effective fusion of multiple CNN features.
  • Team Tactics Estimation in Soccer Videos Based on a Deep Extreme Learning Machine and Characteristics of the Tactics.
    Genki Suzuki, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 7, 153238, 153248, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), A novel method for estimating team tactics in soccer videos based on a Deep Extreme Learning Machine (DELM) and unique characteristics of tactics is presented in this paper. The proposed method estimates the tactics of each team from players formations and enables successful training from a limited amount of training data. Specifically, the estimation of tactics consists of two stages. First, by utilizing two DELMs corresponding to the two teams, the proposed method estimates the provisional tactics of each team. Second, the proposed method updates the team tactics based on unique characteristics of soccer tactics, the relationship between tactics of the two teams and information on ball possession. Consequently, since the proposed method estimates the team tactics that satisfy these characteristics, accurate estimation results can be obtained. In an experiment, the proposed method is applied to actual soccer videos to verify its effectiveness.
  • Interest Level Estimation Based on Tensor Completion via Feature Integration for Partially Paired User's Behavior and Videos.
    Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 7, 148576, 148585, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), A novel method for interest level estimation based on tensor completion via feature integration for partially paired users' behavior and videos is presented in this paper. The proposed method defines a novel canonical correlation analysis (CCA) framework that is suitable for interest level estimation, which is a hybrid version of semi-supervised CCA (SemiCCA) and supervised locality preserving CCA (SLPCCA) called semi-supervised locality preserving CCA (S2LPCCA). For partially paired users' behavior and videos in actual shops and on the Internet, new integrated features that maximize the correlation between partially paired samples by the principal component analysis (PCA)-mixed CCA framework are calculated. Then videos that users have not watched can be used for the estimation of users' interest levels. Furthermore, local structures of partially paired samples in the same class are preserved for accurate estimation of interest levels. Tensor completion, which can be applied to three contexts, videos, users and "canonical features and interest levels," is used for estimation of interest levels. Consequently, the proposed method realizes accurate estimation of users' interest levels based on S2LPCCA and the tensor completion from partially paired training features of users' behavior and videos. Experimental results obtained by applying the proposed method to actual data show the effectiveness of the proposed method.
  • Consensus Clustering of Tweet Networks via Semantic and Sentiment Similarity Estimation.
    Ryosuke Harakawa, Shoji Takimura, Takahiro Ogawa, Miki Haseyama, Masahiro Iwahashi
    IEEE Access, 7, 116207, 116217, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), Although Twitter has become an important source of information, the number of accessible tweets is too large for users to easily find their desired information. To overcome this difficulty, a method for tweet clustering is proposed in this paper. Inspired by the reports that network representation is useful for multimedia content analysis including clustering, a network-based approach is employed. Specifically, a consensus clustering method for tweet networks that represent relationships among the tweets' semantics and sentiment are newly derived. The proposed method integrates multiple clustering results obtained by applying successful clustering methods to the tweet networks. By integrating complementary clustering results obtained based on semantic and sentiment features, the accurate clustering of tweets becomes feasible. The contribution of this work can be found in the utilization of the features, which differs from existing network-based consensus clustering methods that target only the network structure. Experimental results for a real-world Twitter dataset, which includes 65 553 tweets of 25 datasets, verify the effectiveness of the proposed method.
  • Music Video Recommendation Based on Link Prediction Considering Local and Global Structures of a Network.
    Array,Array,Array,Miki Haseyama
    IEEE Access, 7, 104155, 104167, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2019年, [査読有り]
    英語, 研究論文(学術雑誌), A novel method for music video recommendation is presented in this paper. The contributions of this paper are two-fold. (i) The proposed method constructs a network, which not only represents relationships between music videos and users but also captures multi-modal features of music videos. This enables collaborative use of multi-modal features such as audio, visual, and textual features, and multiple social metadata that can represent relationships between music videos and users on video hosting services. (ii) A novel scheme for link prediction considering local and global structures of the network (LP-LGSN) is newly derived by fusing multiple link prediction scores based on both local and global structures. By using the LP-LGSN to predict the degrees to which users desire music videos, the proposed method can recommend users' desired music videos. The experimental results for a real-world dataset constructed from YouTube-8M show the effectiveness of the proposed method.
  • Scene Retrieval from Multiple Resolution Generated Images Based on Text-to-image GAN
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama
    2019 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (ISCAS), 1, 5, IEEE, 2019年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), Text-to-image Generative Adversarial Network (GAN) is a deep learning model that generates an image from an input sentence. It is expressly attracting attentions because of its applicability of the generated images. However, many existing studies have still focused on generation of high-quality images, and there are few studies focusing on application of the generated images since text-to-image GANs still cannot produce visually pleasing images in the complicated tasks. In this paper, we apply a text-to-image GAN as a generator of query images for a scene retrieval task to show availability of the visually non-pleasant images. The proposed method utilizes a low-resolution generated image that focuses on a sentence and a high-resolution generated image that focuses on each word of the sentence to retrieve a desired scene. With this mechanism, the proposed method realizes a high-accuracy scene retrieval from a sentence input. Experimental results show the effectiveness of our method.
  • Cardiac sarcoidosis classification with deep convolutional neural network-based features using polar maps.
    Ren Togo, Kenji Hirata, Osamu Manabe, Hiroshi Ohira, Ichizo Tsujino, Keiichi Magota, Takahiro Ogawa, Miki Haseyama, Tohru Shiga
    Computers in biology and medicine, 104, 81, 86, PERGAMON-ELSEVIER SCIENCE LTD, 2019年01月, [査読有り], [国際誌]
    英語, 研究論文(学術雑誌), AIMS: The aim of this study was to determine whether deep convolutional neural network (DCNN)-based features can represent the difference between cardiac sarcoidosis (CS) and non-CS using polar maps. METHODS: A total of 85 patients (33 CS patients and 52 non-CS patients) were analyzed as our study subjects. One radiologist reviewed PET/CT images and defined the left ventricle region for the construction of polar maps. We extracted high-level features from the polar maps through the Inception-v3 network and evaluated their effectiveness by applying them to a CS classification task. Then we introduced the ReliefF algorithm in our method. The standardized uptake value (SUV)-based classification method and the coefficient of variance (CoV)-based classification method were used as comparative methods. RESULTS: Sensitivity, specificity and the harmonic mean of sensitivity and specificity of our method with the ReliefF algorithm were 0.839, 0.870 and 0.854, respectively. Those of the SUVmax-based classification method were 0.468, 0.710 and 0.564, respectively, and those of the CoV-based classification method were 0.655, 0.750 and 0.699, respectively. CONCLUSION: The DCNN-based high-level features may be more effective than low-level features used in conventional quantitative analysis methods for CS classification.
  • Distress classification of class-imbalanced inspection data via correlation-maximizing weighted extreme learning machine
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    Advanced Engineering Informatics, 37, 79, 87, Elsevier Ltd, 2018年08月01日, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents distress classification of class-imbalanced inspection data via correlation-maximizing weighted extreme learning machine (CMWELM). For distress classification, it is necessary to extract semantic features that can effectively distinguish multiple kinds of distress from a small amount of class-imbalanced data. In recent machine learning techniques such as general deep learning methods, since effective feature transformation from visual features to semantic features can be realized by using multiple hidden layers, a large amount of training data are required. However, since the amount of training data of civil structures becomes small, it becomes difficult to perform successful transformation by using these multiple hidden layers. On the other hand, CMWELM consists of two hidden layers. The first hidden layer performs feature transformation, which can directly extract the semantic features from visual features, and the second hidden layer performs classification with solving the class-imbalanced problem. Specifically, in the first hidden layer, the feature transformation is realized by using projections obtained by maximizing the canonical correlation between visual and text features as weight parameters of the hidden layer without designing multiple hidden layers. Furthermore, the second hidden layer enables successful training of our classifier by using weighting factors concerning the class-imbalanced problem. Consequently, CMWELM realizes accurate distress classification from a small amount of class-imbalanced data.
  • Strategy to develop convolutional neural network-based classifier for diagnosis of whole-body FDG PET images
    Keisuke Kawauchi, Kenji Hirata, Seiya Ichikawa, Osamu Manabe, Kentaro Kobayashi, Shiro Watanabe, Miki Haseyama, Takahiro Ogawa, Ren Togo, Tohru Shiga, Chietsugu Katoh
    Society of Nuclear Medicine and Molecular Imaging Annual Meeting (SNMMI), 59, SOC NUCLEAR MEDICINE INC, 2018年06月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Use of deep convolutional neural network-based features for detection of cardiac sarcoidosis from polar map
    Ren Togo, Kenji Hirata, Osamu Manabe, Hiroshi Ohira, Ichizo Tsujino, Takahiro Ogawa, Miki Haseyama, Tohru Shiga
    Society of Nuclear Medicine and Molecular Imaging Annual Meeting (SNMMI), 59, SOC NUCLEAR MEDICINE INC, 2018年06月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Estimating the quality of fractal compressed images using lacunarity
    Megumi Takezawa, Hirofumi Sanada, Takahiro Ogawa, Miki Haseyama
    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E101A, 6, 900, 903, Institute of Electronics, Information and Communication, Engineers, IEICE, 2018年06月01日, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), In this paper, we propose a highly accurate method for estimating the quality of images compressed using fractal image compression. Using an iterated function system, fractal image compression compresses images by exploiting their self-similarity, thereby achieving high levels of performance
    however, we cannot always use fractal image compression as a standard compression technique because some compressed images are of low quality. Generally, sufficient time is required for encoding and decoding an image before it can be determined whether the compressed image is of low quality or not. Therefore, in our previous study, we proposed a method to estimate the quality of images compressed using fractal image compression. Our previous method estimated the quality using image features of a given image without actually encoding and decoding the image, thereby providing an estimate rather quickly
    however, estimation accuracy was not entirely sufficient. Therefore, in this paper, we extend our previously proposed method for improving estimation accuracy. Our improved method adopts a new image feature, namely lacunarity. Results of simulation showed that the proposed method achieves higher levels of accuracy than those of our previous method.
  • Graph-Based Video Search Reranking with Local and Global Consistency Analysis
    Soh Yoshida, Takahiro Ogawa, Miki Haseyama, Mitsuji Muneyasu
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E101D, 5, 1430, 1440, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2018年05月, [査読有り]
    英語, 研究論文(学術雑誌), Video reranking is an effective way for improving the retrieval performance of text-based video search engines. This paper proposes a graph-based Web video search reranking method with local and global consistency analysis. Generally, the graph-based reranking approach constructs a graph whose nodes and edges respectively correspond to videos and their pairwise similarities. A lot of reranking methods are built based on a scheme which regularizes the smoothness of pairwise relevance scores between adjacent nodes with regard to a user's query. However, since the overall consistency is measured by aggregating only the local consistency over each pair, errors in score estimation increase when noisy samples are included within query-relevant videos' neighbors. To deal with the noisy samples, the proposed method leverages the global consistency of the graph structure, which is different from the conventional methods. Specifically, in order to detect this consistency, the propose method introduces a spectral clustering algorithm which can detect video groups, in which videos have strong semantic correlation, on the graph. Furthermore, a new regularization term, which smooths ranking scores within the same group, is introduced to the reranking framework. Since the score regularization is performed by both local and global aspects simultaneously, the accurate score estimation becomes feasible. Experimental results obtained by applying the proposed method to a real-world video collection show its effectiveness.
  • 映像情報メディア年報2017シリーズ(第8回)メディア工学の研究動向
    長谷山 美紀, 河村 圭, 田良島 周平, 新井 啓之
    映像情報メディア学会誌, Vol.72, No.2, pp.241-246, 2018年03月
    日本語, 研究論文(学術雑誌), 本稿では、(1) 拡張現実・仮想現実の研究動向、(2) 深層学習の研究動向と実用展開、(3) IoT とメディア処理、等、メディア工学分野の研究動向を紹介する。(1)については、デプスセンサやヘッドマウントディスプレイ等のデバイスの登場と性能向上を踏まえつつ、これらを活用した研究開発の進展と動向を紹介する。(2) については、加速度的に進む画像映像メディアへの深層学習技術の適用について、具体的に画像分類や物体検出、さらには画像検索から教師データの検討、実用展開に至るまでを解説する。(3)では、(2) を受けてメディア工学の分野でAI 技術と相乗効果を生み出すIoT 技術について解説する。
  • A Novel Framework for Estimating Viewer Interest by Unsupervised Multimodal Anomaly Detection
    Yuma Sasaka, Takahiro Ogawa, Miki Haseyama
    IEEE Access, 6, 8340, 8350, Institute of Electrical and Electronics Engineers Inc., 2018年02月09日, [査読有り]
    英語, 研究論文(学術雑誌), A reliable method to estimate viewer interest is highly sought after for human-centered video information retrieval. A method that estimates viewer interest while users are watching Web videos is presented in this paper. The method uses a framework for anomaly detection based on collaborative use of facial expression and biological signals such as electroencephalogram (EEG) signals. To the best of our knowledge, there have been no studies that have taken into account two actual mechanisms of the behavior of users while they are watching Web videos. First, whereas most Web videos garner very little attention, a small number attract millions of views. Therefore, a framework for anomaly detection is newly applied to facial expression and EEG in order to model the imbalanced distribution of popularity. Second, since the number of Web videos that are labeled by users as interesting/not interesting is generally too small to estimate viewer interest by a supervised approach, the proposed method utilizes parametric techniques for anomaly detection, which estimates viewer interest in an unsupervised way. Unlike some related studies for estimating viewer interest, our method takes into account actual mechanisms of the behavior of users while they are watching Web videos by utilizing parametric techniques for anomaly detection. Then viewer interest can be estimated on the basis of an anomaly score calculated from our proposed method. Consequently, successful estimation of viewer interest based on a framework for anomaly detection, via collaborative use of facial expression and biological signals, becomes feasible.
  • Accurate estimation of personalized video preference using multiple users' viewing behavior
    Yoshiki Ito, Takahiro Ogawa, Miki Haseyama
    IEICE Transactions on Information and Systems, E101D, 2, 481, 490, Institute of Electronics, Information and Communication, Engineers, IEICE, 2018年02月01日, [査読有り]
    英語, 研究論文(学術雑誌), A method for accurate estimation of personalized video preference using multiple users' viewing behavior is presented in this paper. The proposed method uses three kinds of features: a video, user's viewing behavior and evaluation scores for the video given by a target user. First, the proposed method applies Supervised Multiview Spectral Embedding (SMSE) to obtain lower-dimensional video features suitable for the following correlation analysis. Next, supervised Multi-View Canonical Correlation Analysis (sMVCCA) is applied to integrate the three kinds of features. Then we can get optimal projections to obtain new visual features, "canonical video features" reflecting the target user's individual preference for a video based on sMVCCA. Furthermore, in our method, we use not only the target user's viewing behavior but also other users' viewing behavior for obtaining the optimal canonical video features of the target user. This unique approach is the biggest contribution of this paper. Finally, by integrating these canonical video features, Support Vector Ordinal Regression with Implicit Constraints (SVORIM) is trained in our method. Consequently, the target user's preference for a video can be estimated by using the trained SVORIM. Experimental results show the effectiveness of our method.
  • Media engineering
    Miki Haseyama, Kei Kawamura, Shuhei Tarashima, Hiroyuki Arai
    Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 72, 3, 241, 246, Inst. of Image Information and Television Engineers, 2018年
    日本語, 研究論文(学術雑誌)
  • Sentiment-aware personalized tweet recommendation through multimodal FFM
    Ryosuke Harakawa, Daichi Takehara, Takahiro Ogawa, Miki Haseyama
    Multimedia Tools and Applications, 77, 14, 18741, 18759, SPRINGER, 2018年, [査読有り]
    英語, 研究論文(学術雑誌), For realizing quick and accurate access to desired information and effective advertisements or election campaigns, personalized tweet recommendation is highly demanded. Since multimedia contents including tweets are tools for users to convey their sentiment, users' interest in tweets is strongly influenced by sentiment factors. Therefore, successful personalized tweet recommendation can be realized if sentiment in tweets can be estimated. However, sentiment factors were not taken into account in previous works and the performance of previous methods may be limited. To overcome the limitation, a method for sentiment-aware personalized tweet recommendation through multimodal Field-aware Factorization Machines (FFM) is newly proposed in this paper. Successful personalized tweet recommendation becomes feasible through the following three contributions: (i) sentiment factors are newly introduced into personalized tweet recommendation, (ii) users' interest is modeled by deriving multimodal FFM that enables collaborative use of multiple factors in a tweet, i.e., publisher, topic and sentiment factors, and (iii) the effectiveness of using sentiment factors as well as publisher and topic factors is clarified from results of experiments using real-world datasets related to worldwide hot topics, "#trump", "#hillaryclinton" and "#ladygaga". In addition to showing the effectiveness of the proposed method, the applicability of the proposed method to other tasks such as advertisement and social analysis is discussed as a conclusion and future work of this paper.
  • Favorite Video Estimation Based on Multiview Feature Integration via KMvLFDA.
    Array,Array,Miki Haseyama
    IEEE Access, 6, 63833, 63842, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2018年, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents a novel method for favorite video estimation based on multiview feature integration via kernel multiview local fisher discriminant analysis (KMvLFDA). The proposed method first extracts electroencephalogram (EEG) features from users' EEG signals recorded while watching videos and multiple visual features from videos. Then, multiple EEG-based visual features are obtained by applying locality preserving canonical correlation analysis to EEG features and each visual feature. Next, KMvLFDA, which is newly derived in this paper, explores the complementary properties of different features and integrates the multiple EEG-based visual features. In addition, by using KMvLFDA, between-class scatter is maximized and within-class scatter is minimized in the integrated feature space. Consequently, it can be expected that the new features that are obtained by the above integration are more effective than each of the EEG-based visual features for the estimation of users' favorite videos. The main contribution of this paper is the new derivation of KMvLFDA. Successful estimation of users' favorite videos becomes feasible by using the new features obtained via KMvLFDA.
  • Favorite Video Classification Based on Multimodal Bidirectional LSTM.
    Array,Array, Keisuke Maeda, Miki Haseyama
    IEEE Access, 6, 61401, 61409, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2018年, [査読有り]
    英語, 研究論文(学術雑誌), Video classification based on the user's preference (information of what a user likes: WUL) is important for realizing human-centered video retrieval. A better understanding of the rationale of WUL would greatly contribute to the support for successful video retrieval. However, a few studies have shown the relationship between information of what a user watches and WUL. A new method that classifies videos on the basis of WUL using video features and electroencephalogram (EEG) signals collaboratively with a multimodal bidirectional Long Short-Term Memory (Bi-LSTM) network is presented in this paper. To the best of our knowledge, there has been no study on WUL-based video classification using video features and EEG signals collaboratively with LSTM. First, we newly apply transfer learning to the WUL-based video classification since the number of labels (liked or not liked) attached to videos by users is small, and it is difficult to classify videos based on WUL. Furthermore, we conduct a user study for showing that the representation of psychophysiological signals calculated from Bi-LSTM is effective for the WUL-based video classification. Experimental results showed that our deep neural network feature representations can distinguish WUL for each subject.
  • Selection of Significant Brain Regions Based on MvGTDA and TS-DLF for Emotion Estimation.
    Array,Array,Miki Haseyama
    IEEE Access, 6, 32481, 32492, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2018年, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, we propose a novel method for estimating human emotion using functional brain images. The final goal of our study is contribution to affective brain computer interfaces (aBCIs), which use neuropsychological signals. In the proposed method, we newly derive multiview general tensor discriminant analysis (MvGTDA) in order to reveal significant brain regions and accurately estimate human emotion evoked by visual stimuli. This is because it is important to find activation of multiple brain regions for estimating emotional states. Since we regard a Brodmann area as a view and introduce -norm regularization for these views, MvGTDA can eliminate non-crucial Brodmann areas and select significant ones. Moreover, in general studies on functional brain images based on machine learning methodologies, there is an overfitting problem caused by a small sample size. Therefore, revealing significant Brodmann areas based on MvGTDA has another important role, i.e., solving the overfitting problem. By inputting estimation results respectively obtained from the significant areas and the MvGTDA-based feature, tensor-based supervised decision-level fusion (TS-DLF) integrates them and outputs the final estimation result of the users emotion. In experiments, we showed the effectiveness of our method by using actual functional brain images and we revealed the significant brain regions in emotional states.
  • A Language-Independent Ontology Construction Method Using Tagged Images in Folksonomy.
    Array,Takahiro Ogawa, Miki Haseyama
    IEEE Access, 6, 2930, 2942, 2018年, [査読有り]
    研究論文(学術雑誌)
  • Tracking topic evolution via salient keyword matching with consideration of semantic broadness for Web video discovery
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    Multimedia Tools and Applications, 77, 16, 1, 28, Springer New York LLC, 2017年12月06日, [査読有り]
    英語, 研究論文(学術雑誌), A method to track topic evolution via salient keyword matching with consideration of semantic broadness for Web video discovery is presented in this paper. The proposed method enables users to understand the evolution of topics over time for discovering Web videos in which they are interested. A framework that enables extraction and tracking of the hierarchical structure, which contains Web video groups with various degrees of semantic broadness, is newly derived as follows: Based on network analysis using multimodal features, i.e., features of video contents and metadata, our method extracts the hierarchical structure and salient keywords that represent contents of each Web video group. Moreover, salient keyword matching, which is newly developed by considering salient keyword distribution, semantic broadness of each Web video group and initial topic relevance, is applied to each hierarchical structure obtained in different time stamps. Unlike methods in previous works, by considering the semantic broadness as well as the salient keyword distribution, our method can overcome the problem of the desired semantic broadness of topics being different depending on each user. Also, the initial topic relevance enables correction of the gap from an initial topic at the start of tracking. Consequently, it becomes feasible to track the evolution of topics over time for finding Web videos in which the users are interested. Experimental results for real-world datasets containing YouTube videos verify the effectiveness of the proposed method.
  • Extracting hierarchical structure of content groups from different social media platforms using multiple social metadata
    Daichi Takehara, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    MULTIMEDIA TOOLS AND APPLICATIONS, 76, 19, 20249, 20272, SPRINGER, 2017年10月, [査読有り]
    英語, 研究論文(学術雑誌), A novel scheme for retrieving users' desired contents, i.e., contents with topics in which users are interested, from multiple social media platforms is presented in this paper. In existing retrieval schemes, users first select a particular platform and then input a query into the search engine. If users do not specify suitable platforms for their information needs and do not input suitable queries corresponding to the desired contents, it becomes difficult for users to retrieve the desired contents. The proposed scheme extracts the hierarchical structure of content groups (sets of contents with similar topics) from different social media platforms, and it thus becomes feasible to retrieve desired contents even if users do not specify suitable platforms and do not input suitable queries. This paper has two contributions: (1) A new feature extraction method, Locality Preserving Canonical Correlation Analysis with multiple social metadata (LPCCA-MSM) that can detect content groups without the boundaries of different social media platforms is presented in this paper. LPCCA-MSM uses multiple social metadata as auxiliary information unlike conventional methods that only use content-based information such as textual or visual features. (2) The proposed novel retrieval scheme can realize hierarchical content structuralization from different social media platforms. The extracted hierarchical structure shows various abstraction levels of content groups and their hierarchical relationships, which can help users select topics related to the input query. To the best of our knowledge, an intensive study on such an application has not been conducted; therefore, this paper has strong novelty. To verify the effectiveness of the above contributions, extensive experiments for real-world datasets containing YouTube videos and Wikipedia articles were conducted.
  • Wiener-Based Inpainting Quality Prediction
    Takahiro Ogawa, Akira Tanaka, Miki Haseyama
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E100D, 10, 2614, 2626, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2017年10月, [査読有り]
    英語, 研究論文(学術雑誌), A Wiener-based inpainting quality prediction method is presented in this paper. The proposed method is the first method that can predict inpainting quality both before and after the intensities have become missing even if their inpainting methods are unknown. Thus, when the target image does not include any missing areas, the proposed method estimates the importance of intensities for all pixels, and then we can know which areas should not be removed. Interestingly, since this measure can be also derived in the same manner for its corrupted image already including missing areas, the expected difficulty in reconstruction of these missing pixels is predicted, i.e., we can know which missing areas can be successfully reconstructed. The proposed method focuses on expected errors derived from the Wiener filter, which enables least-squares reconstruction, to predict the inpainting quality. The greatest advantage of the proposed method is that the same inpainting quality prediction scheme can be used in the above two different situations, and their results have common trends. Experimental results show that the inpainting quality predicted by the proposed method can be successfully used as a universal quality measure.
  • Visualizing Web Images Using Fisher Discriminant Locality Preserving Canonical Correlation Analysis
    Kohei Tateno, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E100D, 9, 2005, 2016, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2017年09月, [査読有り]
    英語, 研究論文(学術雑誌), A novel dimensionality reduction method, Fisher Discriminant Locality Preserving Canonical Correlation Analysis (FDLPCCA), for visualizing Web images is presented in this paper. FDLP-CCA can integrate two modalities and discriminate target items in terms of their semantics by considering unique characteristics of the two modalities. In this paper, we focus onWeb images with text uploaded on Social Networking Services for these two modalities. Specifically, text features have high discriminate power in terms of semantics. On the other hand, visual features of images give their perceptual relationships. In order to consider both of the above unique characteristics of these two modalities, FDLPCCA estimates the correlation between the text and visual features with consideration of the cluster structure based on the text features and the local structures based on the visual features. Thus, FDLP-CCA can integrate the different modalities and provide separated manifolds to organize enhanced compactness within each natural cluster.
  • Biomimetics Image Retrieval Platform
    Miki Haseyama, Takahiro Ogawa, Sho Takahashi, Shuhei Nomura, Masatsugu Shimomura
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E100D, 8, 1563, 1573, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2017年08月, [査読有り]
    英語, 研究論文(学術雑誌), Biomimetics is a new research field that creates innovation through the collaboration of different existing research fields. However, the collaboration, i.e., the exchange of deep knowledge between different research fields, is difficult for several reasons such as differences in technical terms used in different fields. In order to overcome this problem, we have developed a new retrieval platform, "Biomimetics image retrieval platform," using a visualization-based image retrieval technique. A biological database contains a large volume of image data, and by taking advantage of these image data, we are able to overcome limitations of text-only information retrieval. By realizing such a retrieval platform that does not depend on technical terms, individual biological databases of various species can be integrated. This will allow not only the use of data for the study of various species by researchers in different biological fields but also access for a wide range of researchers in fields ranging from materials science, mechanical engineering and manufacturing. Therefore, our platform provides a new path bridging different fields and will contribute to the development of biomimetics since it can overcome the limitation of the traditional retrieval platform.
  • Deterioration Level Estimation on Transmission Towers via Extreme Learning Machine based on Combination Use of Local Receptive Field and Principal Component Analysis               
    K. Maeda, S. Takahashi, T. Ogawa, M. Haseyama
    International Technical Conference on Circuits/Systems, Computers and Communications (ITC-CSCC), 457, 458, 2017年07月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Effectiveness Evaluation of Imaging Direction for Estimation of Gastritis Regions on Gastric X-ray Images               
    Ren Togo, Kenta Ishihara, Takahiro Ogawa, Miki Haseyama
    International Technical Conference on Circuits, Systems, Computers, and Communications (ITC-CSCC), 459, 460, 2017年05月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Helicobacter Pylori infection detection from gastric X-ray images based on feature fusion and decision fusion
    Kenta Ishihara, Takahiro Ogawa, Miki Haseyama
    COMPUTERS IN BIOLOGY AND MEDICINE, 84, 69, 78, PERGAMON-ELSEVIER SCIENCE LTD, 2017年05月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a fully automatic method for detection of Helicobacter pylori (H. pylori) infection is presented with the aim of constructing a computer-aided diagnosis (CAD) system. In order to realize a CAD system with good performance for detection of H. pylori infection, we focus on the following characteristic of stomach X-ray examination. The accuracy of X-ray examination differs depending on the symptom of H. pylori infection that is focused on and the position from which X-ray images are taken. Therefore, doctors have to comprehensively assess the symptoms and positions. In order to introduce the idea of doctors' assessment into the CAD system, we newly propose a method for detection of H. pylori infection based on the combined use of feature fusion and decision fusion. As a feature fusion scheme, we adopt Multiple Kernel Learning (MKL). Since MKL can combine several features with determination of their weights, it can represent the differences in symptoms. By constructing an MKL classifier for each position, we can obtain several detection results. Furthermore, we introduce confidence-based decision fusion, which can consider the relationship between the classifier's performance and the detection results. Consequently, accurate detection of H. pylori infection becomes possible by the proposed method. Experimental results obtained by applying the proposed method to real X-ray images show that our method has good performance, close to the results of detection by specialists, and indicate that the realization of a CAD system for determining the risk of H. pylori infection is possible.
  • Tracking hierarchical structure of web video groups based on salient keyword matching including semantic broadness estimation
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    2016 IEEE Global Conference on Signal and Information Processing, GlobalSIP 2016 - Proceedings, 1238, 1242, Institute of Electrical and Electronics Engineers Inc., 2017年04月19日, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel method to track the hierarchical structure of Web video groups on the basis of salient keyword matching including semantic broadness estimation. To the best of our knowledge, this paper is the first work to perform extraction and tracking of the hierarchical structure simultaneously. Specifically, the proposed method first extracts the hierarchical structure of Web video groups and salient keywords of them on the basis of an improved scheme of our previously reported method. Moreover, to calculate similarities between Web video groups obtained in different time stamps, salient keyword matching is newly developed by considering both co-occurrences of the salient keywords and semantic broadness of each Web video group. Consequently, tracking of the hierarchical structure over time becomes feasible to easily understand popularity trends of many Web videos for realizing effective retrieval.
  • Distress Classification of Class Imbalanced Data for Maintenance Inspection of Road Structures in Express Way               
    K. Maeda, S. Takahashi, T. Ogawa, M. Haseyama
    International Conference on Civil and Building Engineering Informatics in conjunction with Conference on Computer Applications in Civil and Hydraulic Engineering (ICCBEI & CCACHE), 182, 185, 2017年04月, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • Human-Centered Video Feature Selection via mRMR-SCMMCCA for Preference Extraction
    Takahiro Ogawa, Yoshiaki Yamaguchi, Satoshi Asamizu, Miki Haseyama
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E100D, 2, 409, 412, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2017年02月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents human-centered video feature selection via mRMR-SCMMCCA (minimum Redundancy and Maximum Relevance-Specific Correlation Maximization Multiset Canonical Correlation Analysis) algorithm for preference extraction. The proposed method derives SCMMCCA, which simultaneously maximizes two kinds of correlations, correlation between video features and users' viewing behavior features and correlation between video features and their corresponding rating scores. By monitoring the derived correlations, the selection of the optimal video features that represent users' individual preference becomes feasible.
  • PERSONALIZED VIDEO PREFERENCE ESTIMATION BASED ON EARLY FUSION USING MULTIPLE USERS'VIEWING BEHAVIOR
    Yoshiki Ito, Takahiro Ogawa, Miki Haseyama
    2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 3006, 3010, IEEE, 2017年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel method for personalized video preference estimation based on early fusion using multiple users' viewing behavior. The proposed method adopts supervised Multi-View Canonical Correlation Analysis (sMVCCA) to estimate correlation between different types of features. Specifically, we estimate optimal projections maximizing the correlation between three features of video, target user's viewing behavior and evaluation scores for video. Then novel video features (canonical video features), which reflect the target user's individual preference, are obtained by the estimated projections. Furthermore, our method computes sMVCCA-based canonical video features by using multiple users' viewing behavior and a target user's evaluation scores. This non-conventional approach using the multiple users' viewing behavior for the preference estimation of the target user is the biggest contribution of our method, and it enables early fusion of the canonical video features. Consequently, successful video recommendation that reflects the users' individual preference can be expected via the evaluation score prediction from the integrated canonical video features. Experimental results show the effectiveness of our method.
  • EXEMPLAR-BASED IMAGE COMPLETION VIA NEW QUALITY MEASURE BASED ON PHASELESS TEXTURE FEATURES
    Takahiro Ogawa, Miki Haseyama
    2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 1827, 1831, IEEE, 2017年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an exemplar-based image completion via a new quality measure based on phaseless texture features. The proposed method derives a new quality measure obtained by monitoring errors caused in power spectra, i.e., errors of phaseless texture features, converged through phase retrieval. Even if a target patch includes missing pixels, this measure enables selection of the best matched patch including the most similar texture features for realizing the exemplar-based image completion. Furthermore, since the phaseless texture features are robust to various changes such as spatial gaps and luminance changes, the new quality measure successfully provides the best matched patch from few training examples. Then, by solving an optimization problem that retrieves the phase of the target patch from the phaseless texture features of the best matched patch, its missing areas can be reconstructed. Consequently, accurate image completion using the new quality measure becomes feasible. Subjective and quantitative experimental results are shown to verify the effectiveness of our method using the new quality measure.
  • EMOTION ESTIMATION VIA TENSOR-BASED SUPERVISED DECISION-LEVEL FUSION FROM MULTIPLE BRODMANN AREAS
    Kento Sugata, Takahiro Ogawa, Miki Haseyama
    2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 999, 1003, IEEE, 2017年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel method that estimates human emotion based on tensor-based supervised decision-level fusion (TS-DLF) from multiple Brodmann areas (BAs). From multiple brain data corresponding to these BAs captured by functional magnetic resonance imaging (fMRI), our method performs general tensor discriminant analysis (GTDA) to obtain features which can reflect the user's emotion. Furthermore, since the dimension of the obtained features becomes lower, this can avoid overfitting in the following training procedure of estimators. Next, by separately using the transformed BA data obtained after GTDA, we obtain multiple estimation results of the user's emotion based on logistic tensor regression (LTR). Then our method realizes the decision of the final result based on TS-DLF from the multiple estimation results. This approach, i.e., the integration of the multiple BAs' results for the whole-brain data, is the biggest contribution of this paper. TS-DLF successfully integrates the multiple estimation results with considering the performance of the LTR-based estimator constructed for each BA. Experimental results show that our method outperforms state-of-the-art approaches, and the effectiveness of our method can be confirmed.
  • Extracting Hierarchical Structure of Web Video Groups Based on Sentiment-Aware Signed Network Analysis
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    IEEE ACCESS, 5, 16963, 16973, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2017年, [査読有り]
    英語, 研究論文(学術雑誌), Sentiment in multimedia contents has an influence on their topics, since multimedia contents are tools for social media users to convey their sentiment. Performance of applications such as retrieval and recommendation will be improved if sentiment in multimedia contents can be estimated; however, there have been few works in which such applications were realized by utilizing sentiment analysis. In this paper, a novel method for extracting the hierarchical structure of Web video groups based on sentiment-aware signed network analysis is presented to realize Web video retrieval. First, the proposed method estimates latent links between Web videos by using multimodalfeatures of contents and sentiment features obtained from texts attached to Web videos. Thus, our method enables construction of a signed network that reflects not only similarities but also positive and negative relations between topics of Web videos. Moreover, an algorithm to optimize a modularity-based measure, which can adaptively adjust the balance between positive and negative edges, was newly developed. This algorithm detects Web video groups with similar topics at multiple abstraction levels; thus, successful extraction of the hierarchical structure becomes feasible. By providing the hierarchical structure, users can obtain an overview of many Web videos and it becomes feasible to successfully retrieve the desired Web videos. Results of experiments using a new benchmark dataset, YouTube-8M, validate the contributions of this paper, i.e., 1) the first attempt to utilize sentiment analysis for Web video grouping and 2) a novel algorithm for analyzing a weighted signed network derived from sentiment and multimodal features.
  • Retrieval of similar inspection records based on metric learning using experienced inspectors' evaluation
    Ryota Saito, Sho Takahashi, Takahiro Ogawa, Miki Hasayama
    2016 IEEE 5th Global Conference on Consumer Electronics, GCCE 2016, 1, 2, Institute of Electrical and Electronics Engineers Inc., 2016年12月27日, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a retrieval method of similar inspection records in road structures based on metric learning using experienced inspectors' evaluation. Inspection records of road structures include images and text-based information such as category of distress, damaged parts and degree of damage. The proposed method calculates distances from query inspection records, and rank lists of retrieval results are obtained for each feature. In this approach, the distance quantification are updated on the basis of experienced inspectors' evaluation. Finally, the proposed method obtains retrieval results by integrating the multiple rank lists. The experimental results show the effectiveness of the proposed method.
  • Adaptive Subspace-Based Inverse Projections via Division Into Multiple Sub-Problems for Missing Image Data Restoration
    Takahiro Ogawa, Miki Haseyama
    IEEE TRANSACTIONS ON IMAGE PROCESSING, 25, 12, 5971, 5986, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2016年12月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents adaptive subspace-based inverse projections via division into multiple sub-problems (ASIP-DIMSs) for missing image data restoration. In the proposed method, a target problem for estimating missing image data is divided into multiple sub-problems, and each sub-problem is iteratively solved with the constraints of other known image data. By projection into a subspace model of image patches, the solution of each sub-problem is calculated, where we call this procedure "subspace-based inverse projection" for simplicity. The proposed method can use higher dimensional subspaces for finding unique solutions in each sub-problem, and successful restoration becomes feasible, since a high level of image representation performance can be preserved. This is the biggest contribution of this paper. Furthermore, the proposed method generates several subspaces from known training examples and enables derivation of a new criterion in the above framework to adaptively select the optimal subspace for each target patch. In this way, the proposed method realizes missing image data restoration using ASIP-DIMS. Since our method can estimate any kind of missing image data, its potential in two image restoration tasks, image inpainting and super-resolution, based on several methods for multivariate analysis is also shown in this paper.
  • A Web video retrieval method using hierarchical structure of Web video groups
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    MULTIMEDIA TOOLS AND APPLICATIONS, 75, 24, 17059, 17079, SPRINGER, 2016年12月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, we propose a Web video retrieval method that uses hierarchical structure of Web video groups. Existing retrieval systems require users to input suitable queries that identify the desired contents in order to accurately retrieve Web videos; however, the proposed method enables retrieval of the desired Web videos even if users cannot input the suitable queries. Specifically, we first select representative Web videos from a target video dataset by using link relationships between Web videos obtained via metadata "related videos" and heterogeneous video features. Furthermore, by using the representative Web videos, we construct a network whose nodes and edges respectively correspond to Web videos and links between these Web videos. Then Web video groups, i.e., Web video sets with similar topics are hierarchically extracted based on strongly connected components, edge betweenness and modularity. By exhibiting the obtained hierarchical structure of Web video groups, users can easily grasp the overview of many Web videos. Consequently, even if users cannot write suitable queries that identify the desired contents, it becomes feasible to accurately retrieve the desired Web videos by selecting Web video groups according to the hierarchical structure. Experimental results on actual Web videos verify the effectiveness of our method.
  • Performance Improvement of Error-Resilient 3D DWT Video Transmission Using Invertible Codes
    Kotoku Omura, Shoichiro Yamasaki, Tomoko K. Matsushima, Hirokazu Tanaka, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E99A, 12, 2256, 2265, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2016年12月, [査読有り]
    英語, 研究論文(学術雑誌), Many studies have applied the three-dimensional discrete wavelet transform (3D DWT) to video coding. It is known that corruptions of the lowest frequency sub-band (LL) coefficients of 3D DWT severely affect the visual quality of video. Recently, we proposed an error resilient 3D DWT video coding method (the conventional method) that employs dispersive grouping and an error concealment (EC). The EC scheme of our conventional method adopts a replacement technique of the lost LL coefficients. In this paper, we propose a new 3D DWT video transmission method in order to enhance error resilience. The proposed method adopts an error correction scheme using invertible codes to protect LL coefficients. We use half-rate Reed-Solomon (RS) codes as invertible codes. Additionally, to improve performance by using the effect of interleave, we adopt a new configuration scheme at the RS encoding stage. The evaluation by computer simulation compares the performance of the proposed method with that of other EC methods, and indicates the advantage of the proposed method.
  • Classifying Insects from SEM Images Based on Optimal Classifier Selection and D-S Evidence Theory
    Takahiro Ogawa, Akihiro Takahashi, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E99A, 11, 1971, 1980, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2016年11月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, an insect classification method using scanning electron microphotographs is presented. Images taken by a scanning electron microscope (SEM) have a unique problem for classification in that visual features differ from each other by magnifications. Therefore, direct use of conventional methods results in inaccurate classification results. In order to successfully classify these images, the proposed method generates an optimal training dataset for constructing a classifier for each magnification. Then our method classifies images using the classifiers constructed by the optimal training dataset. In addition, several images are generally taken by an SEM with different magnifications from the same insect. Therefore, more accurate classification can be expected by integrating the results from the same insect based on Dempster-Shafer evidence theory. In this way, accurate insect classification can be realized by our method. At the end of this paper, we show experimental results to confirm the effectiveness of the proposed method.
  • Estimation of salient regions related to chronic gastritis using gastric X-ray images
    Ren Togo, Kenta Ishihara, Takahiro Ogawa, Miki Haseyama
    COMPUTERS IN BIOLOGY AND MEDICINE, 77, 9, 15, PERGAMON-ELSEVIER SCIENCE LTD, 2016年10月, [査読有り]
    英語, 研究論文(学術雑誌), Since technical knowledge and a high degree of experience are necessary for diagnosis of chronic gastritis, computer-aided diagnosis (CAD) systems that analyze gastric X-ray images are desirable in the field of medicine. Therefore, a new method that estimates salient regions related to chronic gastritis/non-gastritis for supporting diagnosis is presented in this paper. In order to estimate salient regions related to chronic gastritis/non-gastritis, the proposed method monitors the distance between a target image feature and Support Vector Machine (SVM)-based hyperplane for its classification. Furthermore, our method realizes removal of the influence of regions outside the stomach by using positional relationships between the stomach and other organs. Consequently, since the proposed method successfully estimates salient regions of gastric X-ray images for which chronic gastritis and non-gastritis are unknown, visual support for inexperienced clinicians becomes feasible. (C) 2016 Elsevier Ltd. All rights reserved.
  • 画像共有サービスに投稿される画像の観光名所に関するカテゴリー分類
    斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀
    電子情報通信学会論文誌D 情報・システム, J99-D, 9, 848, 860, The Institute of Electronics, Information and Communication Engineers, 2016年09月01日, [査読有り]
    日本語, 本論文では,画像共有サービスに投稿される画像の観光名所に関するカテゴリー(観光カテゴリー)の分類手法を提案する.提案手法では,画像共有サービスにおいて画像とともに投稿される様々なデータの中で,位置座標が観光カテゴリーの分類に最も効果的であることに注目する.更に,このデータに基づいた分類において誤りが発生する場合を,分類結果から導出される確信度に基づいて判定する.誤分類と判定された場合,提案手法では,画像及びタグの特徴に基づいた分類結果を求め,それらを各々の分類精度に注目して統合することで,最終的な分類結果を高精度に推定可能とする.このとき,位置座標による分類結果に基づいて分類候補の観光カテゴリーを限定することで,多クラス分類問題におけるクラス数を減少させ,より正確な分類を可能とする.以上の提案手法によって,異なる種類のデータの分類精度が互いに大きく異なる場合に従来手法では困難であった高精度な最終分類結果の取得が可能となる.
  • NMF-Based Spectral Reflectance Estimation From Image Pairs Including Near-Infrared Components
    Takahiro Ogawa, Yuta Igarashi, Miki Haseyama
    IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, 26, 5, 855, 867, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2016年05月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a novel spectral reflectance estimation method from image pairs including near-infrared (NIR) components based on nonnegative matrix factorization (NMF) is presented. The proposed method enables estimation of spectral reflectance from only two kinds of input images: 1) an image including both visible light components and NIR components and 2) an image including only NIR components. These two images can be easily obtained using a general digital camera without an infrared-cut filter and one with a visible light-cut filter, respectively. Since RGB values of these images are obtained according to spectral sensitivity of the image sensor, the spectrum power distribution of the light source and the spectral reflectance, we have to solve the inverse problem for estimating the spectral reflectance. Therefore, our method approximates spectral reflectance by a linear combination of several bases obtained by applying NMF to a known spectral reflectance data set. Then estimation of the optimal solution to the above problem becomes feasible based on this approximation. In the proposed method, NMF is used for obtaining the bases used in this approximation from a characteristic that the spectral reflectance is a nonnegative component. Furthermore, the proposed method realizes simple approximation of the spectrum power distribution of the light source with direct and scattered light components. Therefore, estimation of spectral reflectance becomes feasible using the spectrum power distribution of the light source in our method. In the last part of this paper, we show some simulation results to verify the performance of the proposed method. The effectiveness of the proposed method is also shown using the method for several applications that are closely related to spectral reflectance estimation. Although our method is based on a simple scheme, it is the first method that realizes the estimation of the spectral reflectance and the spectrum power distribution of the light source from the above two kinds of images taken by general digital cameras and provides breakthroughs to several fundamental applications.
  • A Most Resource-Consuming Disease Estimation Method from Electronic Claim Data Based on Labeled LDA
    Yasutaka Hatakeyama, Takahiro Ogawa, Hironori Ikeda, Miki Haseyama
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E99D, 3, 763, 768, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2016年03月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, we propose a method to estimate the most resource-consuming disease from electronic claim data based on Labeled Latent Dirichlet Allocation (Labeled LDA). The proposed method models each electronic claim from its medical procedures as a mixture of resource-consuming diseases. Thus, the most resource-consuming disease can be automatically estimated by applying Labeled LDA to the electronic claim data. Although our method is composed of a simple scheme, this is the first trial for realizing estimation of the most resource-consuming disease.
  • Distress Classification of Road Structures via Multiple Classifier-based Bayesian Network               
    K. Maeda, S. Takahashi, T. Ogawa, M. Haseyama
    International Workshop on Advanced Image Technology (IWAIT), 1, 4, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • 6. サッカー映像における試合内容の理解を促すデータの可視化
    高橋 翔, 長谷山 美紀
    映像情報メディア学会誌, 70, 9, 722, 724, 一般社団法人 映像情報メディア学会, 2016年
    日本語
  • Multimodal Interest Level Estimation via Variational Bayesian Mixture of Robust CCA
    Yuma Sasaka, Takhiro Ogawa, Miki Haseyama
    MM'16: PROCEEDINGS OF THE 2016 ACM MULTIMEDIA CONFERENCE, 387, 391, ASSOC COMPUTING MACHINERY, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method which estimates interest level while watching videos, based on collaborative use of facial expression and biological signals such as electroencephalogram (EEG) and electrocardiogram (ECG). To the best of our knowledge, no studies have been carried out on the collaborative use of facial expression and biological signals for estimating interest level. Since training data, which is used for estimating interest level, is generally small and imbalanced, Variational Bayesian Mixture of Robust Canonical Correlation Analysis (VBMRCCA) is newly applied to facial expression and biological signals, which are obtained from users while they are watching the videos. Unlike some related works, VBMRCCA is used to obtain the posterior distributions which represent the latent correlation between facial expression and biological signals in our method. Then, the users' interest level can be estimated by comparing the posterior distributions of the positive class data with those of the negative. Consequently, successful interest level estimation, via collaborative use of facial expression and biological signals, becomes feasible.
  • Realization of Associative Image Search Development of Image Retrieval Platform for Enhancing Serendipity
    Miki Haseyama
    2016 IEEE 46TH INTERNATIONAL SYMPOSIUM ON MULTIPLE-VALUED LOGIC (ISMVL 2016), 56, 59, IEEE COMPUTER SOC, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents "Associative Image Search", a new image retrieval scheme and its specific engineering application, which enable value creation from big data. The main aim of the associative image search is the realization of information retrieval that enhances the potential for serendipities by providing users with new awareness. Thus, this paper presents the details of research for realizing associative image retrieval. Furthermore, as an example of its applications, a Biomimetics image retrieval platform is also introduced in this paper. By associatively and collaboratively using data accumulated in the fields of biology and material science, the Biomimetics image retrieval platform enables acceleration of their knowledge sharing in different research fields. From retrieval results actually obtained from this platform, there is discussion of the potential of serendipities such as new knowledge emergence
  • A Virtual Vital Signs Sensor "MIRUWS" for Visualization of Healthy to Illness Transition (HIT)
    Shigenobu Minami, Miki Haseyama, Hirokazu Tanaka, Toru Takahashi, Tatsuya Komori
    2016 10TH INTERNATIONAL SYMPOSIUM ON MEDICAL INFORMATION AND COMMUNICATION TECHNOLOGY (ISMICT), 1, 5, IEEE, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a virtual Vital Signs Sensor (VSS) for visualization of half illness (so called "Mibyou") and sudden illness. Since both half and sudden illnesses, which are located in between wellness and illness, are categorized in healthy(H) to illness(I) transition(T) status. So, we name this status as HIT. Since HIT happens in an ordinary life, VSS for HIT visualization should work for 24 hours continuously and unconsciously.
    The proposed virtual VSS is named as "MIRUWS" which means (M)multi-sensing, (I)integrated, (R)reliable, and (U)unconscious (V)virtual (V)vital (S) signs sensor. All these key words are meaningful and required for professional HIT (Pro-HIT) visualization which has real demand rather than purely personal one.
    MIRUWS is a virtual VSS in a cyber space targeting this Pro-HIT visualization, and is a projection of actual VSSs in a physical space. There are wide varieties of physical sensors such as patch, touch, proximity, and remote types. To handle these wide varieties of VSSs efficiently and consistently, MIRUWS plays as a common and unique virtual VSS in a cyber space.
    Unlikely to medical devices which need very high reliability rather than flexibility, MIRUWS is needed to satisfy both reliability and flexibility at the same time to cover wide range of Pro-HIT use-cases. To realize this, MIRUWS visualizes physical VSS's specifications throughout new API, which are dynamically determined by connected and released physical VSSs in a BAN.
    To certify MIRUWS performance objectively, conformance testing is desired. This paper also presents MIRUWS test environment example, which measures basic vital signs performances, heart rate variation (HRV) and pulse wave transition time (PWTT) using two target physical VSSs at once.
  • An Accurate Mortality Prediction Method Based on Decision-level Fusion of Existing ICU Scoring Systems
    Yasutaka Hatakeyama, Takahiro Ogawa, Hirokazu Tanaka, Miki Haseyama
    PROCEEDINGS OF 2016 INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY AND ITS APPLICATIONS (ISITA 2016), 126, 130, IEEE, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), In this paper, we propose a mortality prediction method based on decision-level fusion (DLF) of existing intensive unit care (ICU) scoring systems. First, the proposed method obtains severity scores from the existing ICU scoring systems. Furthermore, we construct classifiers that categorize patients into survivors or non-survivors. Next, patient feature vectors are extracted based on the mortality rates that are estimated from the obtained severity scores by using a non-linear least squares method to obtain other types of classification results. In order to obtain the final severity score for each patient, we integrate the obtained multiple classification results based on DLF that can estimate the final severity scores. Finally, we performed the proposed method to actual ICU patient data and verified the effectiveness of the proposed method. Thus, the proposed method can realize accurate mortality prediction without any additional work by using the existing ICU scoring systems.
  • GRAPH-BASED WEB VIDEO SEARCH RERANKING THROUGH CONSISTENCY ANALYSIS USING SPECTRAL CLUSTERING
    Soh Yoshida, Takahiro Ogawa, Miki Haseyaina
    2016 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA & EXPO (ICME), 1, 6, IEEE, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a graph-based Web video search reranking method through consistency analysis using spectral clustering. Graph-based reranking is effective for refining text-based video search results. Generally, this approach constructs a graph where the vertices are videos and the edges reflect their pairwise similarities. A lot of reranking methods are built based on a scheme which regularizes the smoothness of pairwise ranking scores between adjacent nodes. However, since the overall consistency is measured by aggregating the individual consistency over each pair, errors in score estimation increase when noisy samples are included within their neighbors. To deal with the noisy samples, different from the conventional methods, the proposed method models the global consistency of the graph structure. Specifically, in order to detect this consistency, the propose method introduces a spectral clustering algorithm which can detect video groups, whose videos have strong semantic correlation, on the graph. Furthermore, a new regularization term, which smooths ranking scores within the same group, is introduced to the reranking framework. Since score regularization is performed by both local and global aspect simultaneously, the accurate score estimation becomes feasible. Experimental results obtained by applying the proposed method to a real-world video collection show its effectiveness.
  • HIERARCHICAL CONTENT GROUP DETECTION FROM DIFFERENT SOCIAL MEDIA PLATFORMS USING WEB LINK STRUCTURE
    Daichi Takehara, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    2016 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 479, 483, IEEE, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method for hierarchical content group detection from different social media platforms, which can reveal hierarchical structure of content groups. In this paper, content groups are defined as sets of contents with similar topics. Based on the revealed hierarchical structure, our method enables users to efficiently find the desired contents from large amount of contents placed in diversified social media platforms. The main contributions of this paper are twofold. First, effective latent features for comparing the contents placed in different social media platforms can be extracted by the combination use of the correlation between features obtained from different social media platform and the Web link structure. Second, the hierarchical structure of the content groups, which captures their various abstraction levels, can be revealed by hierarchically detecting their content groups. Experimental results on the real-world dataset containing YouTube videos and Wikipedia articles show the effectiveness of our method.
  • Distress Classification of Road Structures via Decision Level Fusion
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    2016 IEEE INTERNATIONAL CONFERENCE ON DIGITAL SIGNAL PROCESSING (DSP), 589, 593, IEEE, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A distress classification method of road structures via decision level fusion is presented in this paper. In order to classify various kinds of distresses accurately, the proposed method integrates multiple classification results with considering their performance, and this is the biggest contribution of this paper. By introducing this approach, it becomes feasible to adaptively integrate the multiple classification results based on the accuracy of each classifier for a target sample. Consequently, realization of the accurate distress classification can be expected. Experimental results show that our method outperforms existing methods.
  • Improvement of video coding efficiency based on sparse contractive mapping approach
    Zaixing He, Takahiro Ogawa, Sho Takahashi, Miki Haseyama, Xinyue Zhao
    NEUROCOMPUTING, 173, 1898, 1907, ELSEVIER SCIENCE BV, 2016年01月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents a new method for improving video coding efficiency based on a sparse contractive mapping approach. The proposed method introduces a new sparse contractive mapping approach to replace the traditional intra prediction in the video coding standards such as H.264/AVC. Specifically, the intra- and its following inter-frame are respectively approximated by the sparse representation, satisfying contractive mapping. Then these two frames can be reconstructed from an arbitraryinitial image by utilizing a few representation coefficients. With this advantage, the proposed method reduces the total amount of bits by removing MBs in the target I frame, whose approximation performance is higher than the others in the encoder. Furthermore, by transmitting the representation coefficients of the removed MBs, these MBs can be accurately reconstructed in the decoder. Since the reconstruction performance is better than that of the conventional approach, the proposed method can remove more MBs from the target video sequences, and reduction of total amount of bits can be feasible. Therefore, the proposed method realizes the improvement of the video coding efficiency. Some experimental results are shown to verify the superior performance of the proposed method to that of H.264/AVC. The results also demonstrate that the bit-saving performance of the proposed method is comparable to that of H.2651 HEVC. (C) 2015 Elsevier B.V. All rights reserved.
  • NOVEL FAVORITE MUSIC CLASSIFICATION USING EEG-BASED OPTIMAL AUDIO FEATURES SELECTED VIA KDLPCCA
    Ryosuke Sawata, Takahiro Ogawa, Miki Haseyama
    2016 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING PROCEEDINGS, 759, 763, IEEE, 2016年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel method of favorite music classification using EEG-based optimal audio features. To select audio features related to user's music preference, our method utilizes a relationship between EEG features obtained from the user's EEG signals during listening to music and their corresponding audio features since EEG signals of human reflect his/her music preference. Specifically, cross-loadings, whose components denote the degree of the relationship, are calculated based on Kernel Discriminative Locality Preserving Canonical Correlation Analysis (KDLPCCA) which is newly derived in the proposed method. In contrast with standard CCA, KDLPCCA can consider (1) non-linear correlation, (2) class information and (3) local structures of input EEG and audio features, simultaneously. Therefore, KDLPCCA-based cross-loadings can reflect best correlation between the user's EEG and corresponding audio signals. Then an optimal set of audio features related to his/her music preference can be obtained by employing the cross-loadings as novel criteria for feature selection. Consequently, our method realizes favorite music classification successfully by using the EEG-based optimal audio features.
  • Bregman pooling: Feature-space local pooling for image classification
    Alameen Najjar, Takahiro Ogawa, Miki Haseyama
    International Journal of Multimedia Information Retrieval, 4, 4, 247, 259, Springer London, 2015年12月01日, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, we propose a novel feature-space local pooling method for the commonly adopted architecture of image classification. While existingmethods partition the feature space based on visual appearance to obtain pooling bins, learning more accurate space partitioning that takes semantics into account boosts performance even for a smaller number of bins. To this end, we propose partitioning the feature space over clusters of visual prototypes common to semantically similar images (i.e., images belonging to the same category). The clusters are obtained by Bregman co-clustering applied offline on a subset of training data. Therefore, being aware of the semantic context of the input image, our features have higher discriminative power than do those pooled from appearance-based partitioning. Testing on four datasets (Caltech-101, Caltech-256, 15 Scenes, and 17 Flowers) belonging to three different classification tasks showed that the proposed method outperforms methods in previous works on local pooling in he feature space for less feature dimensionality. Moreover, when implemented within a spatial pyramid, our method achieves comparable results on three of the datasets used.
  • Perceptually Optimized Missing Texture Reconstruction via Neighboring Embedding
    Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E98A, 8, 1709, 1717, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2015年08月, [査読有り]
    英語, 研究論文(学術雑誌), Perceptually optimized missing texture reconstruction via neighboring embedding (NE) is presented in this paper. The proposed method adopts the structural similarity (SSIM) index as a measure for representing texture reconstruction performance of missing areas. This provides a solution to the problem of previously reported methods not being able to perform perceptually optimized reconstruction. Furthermore, in the proposed method, a new scheme for selection of the known nearest neighbor patches for reconstruction of target patches including missing areas is introduced. Specifically, by monitoring the SSIM index observed by the proposed NE-based reconstruction algorithm, selection of known patches optimal for the reconstruction becomes feasible even if target patches include missing pixels. The above novel approaches enable successful reconstruction of missing areas. Experimental results show improvement of the proposed method over previously reported methods.
  • 分類体系に注目した決定木の構築に基づく走査型電子顕微鏡画像を 用いた生物の分類法
    朴 君, 小川 貴弘, 長谷山 美紀
    電子情報通信学会論文誌 D, 情報・システム, 98, 5, 823, 834, 電子情報通信学会, 2015年05月01日
    日本語, 本論文では,走査型電子顕微鏡(Scanning Electron Microscop,SEM)で撮像された画像を用いた生物の分類法を提案する.提案手法では,生物学者が構築した分類体系に注目し,各ノードにその下位のノードへの分類を行う分類器を割り当てることで,決定木を構築する.これにより,構築された決定木を用いて生物の分類が可能となる.このように,生物の分類に有用な分類体系の構造を導入することで,画像特徴のみに注目する生物の分類法と比較して,高精度な分類が期待できる.また,提案手法では,更なる精度向上のため,以下の二つの処理も導入する.まず,分類体系において,画像特徴が類似する異なるノードに注目した決定木の変更を行い,誤分類を抑制する.次に,同種の生物の異なる撮像倍率の画像に対し,モーフィングを施すことで学習データの充足を行う.以上によって,提案手法では,SEMで撮像された生物の高精度な分類が可能となる.本論文の最後では,提案手法の有効性を確認するための実験結果を示す.
  • ものづくりの発想を支援する―バイオミメティクス・画像検索基盤―
    長谷山美紀, 長谷山美紀
    現代化学, 529, 31, 34, 2015年04月01日
    日本語
  • 生物顕微鏡像からものづくりの発想を支援するバイオミメティクス・画像検索
    長谷山美紀
    タクサ, 38, 22, 25, 日本動物分類学会, 2015年02月28日
    日本語, Biomimetics is a new research area that creates innovation through the collaboration of different existing research fields. Since biomimetics brings together expert researchers with deep knowledge of various research fields, there is a need to facilitate the mutual exchange of that knowledge in order to create new research areas. However, this exchange is difficult due to several reasons, e.g., differences in technical terms between different fields. In order to overcome this problem, we started the development of a new data retrieval platform based on the theory of associative image retrieval. A biological database contains many image data, and by taking advantage of these image data, we are able to overcome limitations of text-only information retrieval. If the development of such a retrieval platform that does not depend on text data can be realized, individual biological databases of various species (insects, fish, etc.) will be integrated. This will allow not only the use for the study of the various species by researchers in different biological fields, but also access for a wide range of researchers in fields ranging from materials science, mechanical engineering and manufacturing.
  • Automatic Martian Dust Storm Detection from Multiple Wavelength Data Based on Decision Level Fusion
    Maeda Keisuke, Ogawa Takahiro, Haseyama Miki
    Information and Media Technologies, 10, 3, 473, 477, Information and Media Technologies Editorial Board, 2015年
    英語, This paper presents automatic Martian dust storm detection from multiple wavelength data based on decision level fusion. In our proposed method, visual features are first extracted from multiple wavelength data, and optimal features are selected for Martian dust storm detection based on the minimal-Redundancy-Maximal-Relevance algorithm. Second, the selected visual features are used to train the Support Vector Machine classifiers that are constructed on each data. Furthermore, as a main contribution of this paper, the proposed method integrates the multiple detection results obtained from heterogeneous data based on decision level fusion, while considering each classifiers detection performance to obtain accurate final detection results. Consequently, the proposed method realizes successful Martian dust storm detection.
  • NOVEL IMAGE CLASSIFICATION BASED ON INTEGRATION OF EEG AND VISUAL FEATURES VIA MSLPCCA
    Takuya Kawakami, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 957, 961, IEEE, 2015年
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel image classification method based on integration of EEG and visual features. In the proposed method, we obtain classification results by separately using EEG and visual features. Furthermore, we merge the above classification results based on a kernelized version of Supervised learning from multiple experts and obtain the final classification result. In order to generate feature vectors used for the final image classification, we apply Multiset supervised locality preserving canonical correlation analysis (MSLPCCA), which is newly derived in the proposed method, to EEG and visual features. Our method realizes successful multimodal classification of images by the object categories that they contain based on MSLPCCA-based feature integration.
  • MISSING INTENSITY RESTORATION VIA ADAPTIVE SELECTION OF PERCEPTUALLY OPTIMIZED SUBSPACES
    Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 1628, 1632, IEEE, 2015年
    英語, 研究論文(国際会議プロシーディングス), A missing intensity restoration method via adaptive selection of perceptually optimized subspaces is presented in this paper. In order to realize adaptive and perceptually optimized restoration, the proposed method generates several subspaces of known textures optimized in terms of the structural similarity (SSIM) index. Furthermore, the SSIM-based missing intensity restoration is performed by a projection onto convex sets (POCS) algorithm whose constraints are the obtained subspace and known intensities within the target image. In this approach, a non-convex maximization problem for calculating the projection onto the subspace is reformulated as a quasi-convex problem, and the restoration of the missing intensities becomes feasible. Furthermore, the selection of the optimal subspace is realized by monitoring the SSIM index converged in the POCS algorithm, and the adaptive restoration becomes feasible. Experimental results show that our method outperforms existing methods.
  • Heterogeneous Graph-based Video Search Reranking using Web Knowledge via Social Media Network
    Soh Yoshida, Takahiro Ogawa, Miki Haseyama
    MM'15: PROCEEDINGS OF THE 2015 ACM MULTIMEDIA CONFERENCE, 871, 874, ASSOC COMPUTING MACHINERY, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), Graph-based reranking is effective for refining text-based video search results by making use of the social network structure. Unlike previous works which only focus on an individual video graph, the proposed method leverages the mutual reinforcement of heterogeneous graphs, such as videos and their associated tags obtained by social influence mining. Specifically, propagation of information relevancy across different modalities is performed by exchanging information of inter- and intra-relations among heterogeneous graphs. The proposed method then formulates the video search reranking as an optimization problem from the perspective of Bayesian framework. Furthermore, in order to model the consistency over the modified video graph topology, a local learning regularization with a social community detection scheme is introduced to the framework. Since videos within the same social community have strong semantic correlation, the consistency score estimation becomes feasible. Experimental results obtained by applying the proposed method to a real-world video collection show its effectiveness.
  • HELICOBACTER PYLORI INFECTION DETECTION FROM MULTIPLE X-RAY IMAGES BASED ON COMBINATION USE OF SUPPORT VECTOR MACHINE AND MULTIPLE KERNEL LEARNING
    Kenta Ishihara, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 4728, 4732, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a detection method of Helicobacter pylori (H. pylori) infection from multiple gastric X-ray images based on combination use of Support Vector Machine (SVM) and Multiple Kernel Learning (MKL). The proposed method firstly computes some types of visual features from multiple gastric X-ray images taken in several specific directions in order to represent the characteristics of X-ray images with H. pylori infection. Second, based on the minimal-Redundancy-Maximal-Relevance algorithm, we select the effective features for H. pylori infection detection from each type of visual feature and all visual features. The selected features are used to train the SVM classifier and the MKL classifier for each direction of gastric X-ray images. Finally, the proposed method integrates multiple detection results based on a late fusion scheme considering the detection performance of each classifier. Experimental results obtained by applying the proposed method to real X-ray images prove its effectiveness.
  • AUTOMATIC DETECTION OF MARTIAN DUST STORMS FROM HETEROGENEOUS DATA BASED ON DECISION LEVEL FUSION
    Keisuke Maeda, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2246, 2250, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents automatic detection of Martian dust storms from heterogeneous data (raw data, reflectance data and background subtraction data of the reflectance data) based on decision level fusion. Specifically, the proposed method first extracts image features from these data and selects optimal features for dust storm detection based on the minimal-Redundancy-Maximal-Relevance algorithm. Second, the selected image features are used to train the Support Vector Machine classifier that is constructed on each data. Furthermore, as a main contribution of this paper, the proposed method combines the multiple detection results obtained from the heterogeneous data based on decision level fusion with considering each classifier's detection performance to obtain accurate final detection results. Consequently, the proposed method realizes automatic and accurate detection of Martian dust storms.
  • EXTRACTION OF HIERARCHICAL STRUCTURE OF WEB COMMUNITIES INCLUDING SALIENT KEYWORD ESTIMATION FOR WEB VIDEO RETRIEVAL
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 1021, 1025, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), In this paper, we present a method for extraction of hierarchical structure of Web communities including salient keyword estimation for Web video retrieval. The following two contributions of the proposed method enable retrieval of the desired Web videos even if users cannot input suitable queries that identify the desired contents. First, our method realizes the extraction of hierarchical structure of Web communities, i.e., Web video sets with similar topics by using heterogeneous features of Web videos and link relationships between Web videos obtained via metadata "related videos". Second, we can estimate salient keywords to identify the contents of each obtained Web community at a glance based on text attached to Web videos such as title, the heterogeneous features of Web videos and the link relationships between Web videos. Experimental results on actual Web videos verify that our method can realize accurate retrieval of the desired Web videos via the hierarchical structure of Web communities with their salient keywords.
  • Human-centered Favorite Music Estimation: EEG-based Extraction of Audio Features Reflecting Individual Preference
    Ryosuke Sawata, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON DIGITAL SIGNAL PROCESSING (DSP), 818, 822, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a human-centered method for favorite music estimation using EEG-based audio features. In order to estimate user's favorite musical pieces, our method utilizes his/her EEG signals for calculating new audio features suitable for representing the user's music preference. Specifically, projection, which transforms original audio features into the features reflecting the preference, is calculated by applying kernel Canonical Correlation Analysis (CCA) to the audio features and the EEG features which are extracted from the user's EEG signals during listening to favorite musical pieces. By using the obtained projection, the new EEG-based audio features can be derived since this projection provides the best correlation between the user's EEG signals and their corresponding audio signals. Thus, successful estimation of user's favorite musical pieces via a Support Vector Machine (SVM) classifier using the new audio features becomes feasible. Since our method does not need acquisition of EEG signals for obtaining new audio features from new musical pieces after calculating the projection, this indicates the high practicability of our method. Experimental results show that our method outperforms methods using original audio features or EEG features.
  • Algorithm for Sparse Representation Minimizing Mean Square Error of Power Spectrograms
    Yuma Tanaka, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON DIGITAL SIGNAL PROCESSING (DSP), 618, 622, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), Sparse representation is an idea to approximate a target signal by a linear combination of a small number of sample signals, and it is utilized in various research fields. In this paper, we evaluate the approximation error of signals by the mean square error of power spectrograms (P-MSE). Specifically, we propose a P-MSE minimization algorithm for sparse representation. Our method minimizes the P-MSE by an iterative approach. Specifically, in each iteration, we find the optimal sample signal and optimize the corresponding coefficients by a gradient-based method. In this approach, our method can utilize the result of the previous iteration for fast and stable convergence in the optimization of the coefficients. Based on this algorithm, the sparse representation which minimizes the P-MSE becomes feasible. Experimental results show the effectiveness of our method in terms of the P-MSE minimization.
  • MISSING INTENSITY RESTORATION VIA ADAPTIVE SELECTION OF PERCEPTUALLY OPTIMIZED SUBSPACES
    Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 1628, 1632, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A missing intensity restoration method via adaptive selection of perceptually optimized subspaces is presented in this paper. In order to realize adaptive and perceptually optimized restoration, the proposed method generates several subspaces of known textures optimized in terms of the structural similarity (SSIM) index. Furthermore, the SSIM-based missing intensity restoration is performed by a projection onto convex sets (POCS) algorithm whose constraints are the obtained subspace and known intensities within the target image. In this approach, a non-convex maximization problem for calculating the projection onto the subspace is reformulated as a quasi-convex problem, and the restoration of the missing intensities becomes feasible. Furthermore, the selection of the optimal subspace is realized by monitoring the SSIM index converged in the POCS algorithm, and the adaptive restoration becomes feasible. Experimental results show that our method outperforms existing methods.
  • NOVEL IMAGE CLASSIFICATION BASED ON INTEGRATION OF EEG AND VISUAL FEATURES VIA MSLPCCA
    Takuya Kawakami, Takahiro Ogawa, Miki Haseyama
    2015 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING (ICASSP), 957, 961, IEEE, 2015年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel image classification method based on integration of EEG and visual features. In the proposed method, we obtain classification results by separately using EEG and visual features. Furthermore, we merge the above classification results based on a kernelized version of Supervised learning from multiple experts and obtain the final classification result. In order to generate feature vectors used for the final image classification, we apply Multiset supervised locality preserving canonical correlation analysis (MSLPCCA), which is newly derived in the proposed method, to EEG and visual features. Our method realizes successful multimodal classification of images by the object categories that they contain based on MSLPCCA-based feature integration.
  • Random combination for information extraction in compressed sensing and sparse representation-based pattern recognition
    Zaixing He, Xinyue Zhao, Shuyou Zhang, Takahiro Ogawa, Miki Haseyama
    NEUROCOMPUTING, 145, 160, 173, ELSEVIER SCIENCE BV, 2014年12月, [査読有り]
    英語, 研究論文(学術雑誌), In compressed sensing and sparse representation-based pattern recognition, random projection with a dense random transform matrix is widely used for information extraction. However, the complicated structure makes dense random matrices computationally expensive and difficult in hardware implementation. This paper considers the simplification of the random projection method. First, we propose a simple random method, random combination, for information extraction to address the issues of dense random methods. The theoretical analysis and the experimental results show that it can provide comparable performance to those of dense random methods. Second, we analyze another simple random method, random choosing, and give its applicable occasions. The comparative analysis and the experimental results show that it works well in dense cases but worse in sparse cases. Third, we propose a practical method for measuring the effectiveness of the feature transform matrix in sparse representation-based pattern recognition. A matrix satisfying the Representation Residual Restricted Isometry Property can provide good recognition results. (C) 2014 Elsevier B.V. All rights reserved.
  • Adaptive missing texture reconstruction method based on kernel cross-modal factor analysis with a new evaluation criterion
    Takahiro Ogawa, Mild Haseyama
    SIGNAL PROCESSING, 103, 69, 83, ELSEVIER SCIENCE BV, 2014年10月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents an adaptive missing texture reconstruction method based on kernel cross-modal factor analysis (KCFA) with a new evaluation criterion. The proposed method estimates the latent relationship between two areas, which correspond to a missing area and its neighboring area, respectively, from known parts within the target image and realizes reconstruction of the missing textures. In order to obtain this relationship, KCFA is applied to each cluster containing similar known textures, and the optimal cluster is used for reconstructing each target missing area. Specifically, a new criterion obtained by monitoring errors caused in the latent space enables selection of the optimal cluster. Then each missing texture is adaptively estimated by the optimal cluster's latent relationship, which enables accurate reconstruction of similar textures. In our method, the above criterion is also used for estimating patch priority, which determines the reconstruction order of missing areas within the target image. Since patches, whose textures are accurately modeled by our KCFA-based method, can be selected by using the new criterion, it becomes feasible to perform successful reconstruction of the missing areas. Experimental results show improvements of our KCFA-based reconstruction method over previously reported methods. (C) 2013 Elsevier B.V. All rights reserved.
  • Player Tracking in Far-View Soccer Videos Based on Composite Energy Function
    Kazuya Iwai, Sho Takahashi, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E97D, 7, 1885, 1892, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2014年07月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, an accurate player tracking method in far-view soccer videos based on a composite energy function is presented. In far-view soccer videos, player tracking methods that perform processing based only on visual features cannot accurately track players since each player region becomes small, and video coding causes color bleeding between player regions and the soccer field. In order to solve this problem, the proposed method performs player tracking on the basis of the following three elements. First, we utilize visual features based on uniform colors and player shapes. Second, since soccer players play in such a way as to maintain a formation, which is a positional pattern of players, we use this characteristic for player tracking. Third, since the movement direction of each player tends to change smoothly in successive frames of soccer videos, we also focus on this characteristic. Then we adopt three energies: a potential energy based on visual features, an elastic energy based on formations and a movement direction-based energy. Finally, we define a composite energy function that consists of the above three energies and track players by minimizing this energy function. Consequently, the proposed method achieves accurate player tracking in far-view soccer videos.
  • A new method for error degree estimation in numerical weather prediction via MKDA-based ordinal regression
    Takahiro Ogawa, Shintaro Takahashi, Sho Takahashi, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2014, 115, 115, SPRINGER INTERNATIONAL PUBLISHING AG, 2014年07月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents a new method for estimating error degrees in numerical weather prediction via multiple kernel discriminant analysis (MKDA)-based ordinal regression. The proposed method tries to estimate how large prediction errors will occur in each area from known observed data. Therefore, ordinal regression based on KDA is used for estimating the prediction error degrees. Furthermore, the following points are introduced into the proposed approach. Since several meteorological elements are related to each other based on atmospheric movements, the proposed method merges such heterogeneous features in the target and neighboring areas based on a multiple kernel algorithm. This approach is based on the characteristics of actual meteorological data. Then, MKDA-based ordinal regression for estimating the prediction error degree of a target meteorological element in each area becomes feasible. Since the amount of training data obtained from known observed data becomes very large in the training stage of MKDA, the proposed method performs simple sampling of those training data to reduce the number of samples. We effectively use the remaining training data for determining the parameters of MKDA to realize successful estimation of the prediction error degree.
  • 歌謡番組における映像の構造に注目したシーン分割手法
    吉田壮, 小川貴弘, 長谷山美紀
    電子情報通信学会論文誌 D(Web), J97-D, 7, WEB ONLY 1177-1188, 2014年07月01日
    日本語
  • A Cross-Modal Approach for Extracting Semantic Relationships Between Concepts Using Tagged Images
    Marie Katsurai, Takahiro Ogawa, Miki Haseyama
    IEEE TRANSACTIONS ON MULTIMEDIA, 16, 4, 1059, 1074, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2014年06月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents a cross-modal approach for extracting semantic relationships between concepts using tagged images. In the proposed method, we first project both text and visual features of the tagged images to a latent space using canonical correlation analysis (CCA). Then, under the probabilistic interpretation of CCA, we calculate a representative distribution of the latent variables for each concept. Based on the representative distributions of the concepts, we derive two types of measures: the semantic relatedness between the concepts and the abstraction level of each concept. Because these measures are derived from a cross-modal scheme that enables the collaborative use of both text and visual features, the semantic relationships can successfully reflect semantic and visual contexts. Experiments conducted on tagged images collected from Flickr show that our measures are more coherent to human cognition than the conventional measures that use either text or visual features, or the WordNet-based measures. In particular, a new measure of semantic relatedness, which satisfies the triangle inequality, obtains the best results among different distance measures in our framework. The applicability of our measures to multimedia-related tasks such as concept clustering, image annotation and tag recommendation is also shown in the experiments.
  • メディア理解のための発想支援型検索の試み(パターン認識・メディア理解における組み合わせと統合,文化の振興と教育)
    長谷山 美紀
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 113, 493, 73, 77, 一般社団法人電子情報通信学会, 2014年03月06日
    日本語, 本文では,画像や映像などの非構造化データを有機的に連携し,互いの類似性を効果的に抽出し提示することで,検索者に気づきを与え,発想を支援する検索システムについて紹介する.このような検索システムの実現のためには,マルチモーダル処理が有効である.マルチモーダル処理は,音声信号や楽曲信号などの音響情報,画像・映像情報や行動履歴等,複数の異なるメディアから得られるデータを効率的に利用することで,単一の信号を用いるだけでは解決が困難であった問題に新たな解法を与える.本文では,マルチモーダル処理を用いた映像検索について紹介し,望むコンテンツを効率的に取得するために発想を支援する検索システムの実現の試みについて説明する.
  • 映像の構造に注目したMCMC法に基づくシーン分割法
    SONG Yan, 小川貴弘, 長谷山美紀
    電子情報通信学会論文誌 D, J97-D, 3, 560, 573, 2014年03月
    日本語
  • 映像の構造に注目したMCMC法に基づくシーン分割法(画像・映像処理,<特集>学生論文)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会論文誌. D, 情報・システム, 97, 3, 560, 573, 一般社団法人電子情報通信学会, 2014年03月01日
    日本語, 以前,我々は,映像の類似したショットが隣接せずに出現する構造(映像の構造)に注目したシーン分割手法を提案した.しかしながら,映像の構造に注目したシーン分割手法の共通の問題として,映像の構造を取得する際に用いられるシーンの最長時間幅の設定が困難であるという点が存在した.そこで,本論文では,その改良手法として映像の構造に注目したMCMC法に基づくシーン分割手法を提案する.提案手法では,シーンの最長時間幅を変化させて映像の構造に基づき取得された全ての境界をシーン境界候補とし,それらの中からMCMC法に基づいて最適なシーン境界を推定する.これにより,従来の手法を適用する際に設定が困難であったシーンの最長時間幅を一意に決定することなく,MCMC法により最適なシーン境界を求めることが可能となる.本論文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.
  • MFCC extraction in AAC domain for audio content analysis
    Ai Haojun, Miki Haseyama, Wang Kang
    INFORMATION SCIENCE AND MANAGEMENT ENGINEERING, VOLS 1-3, 46, 1413, 1420, WIT PRESS, 2014年
    英語, 研究論文(国際会議プロシーディングス), We focus the attention on the extraction of Mel-frequency cepstral coefficients (MFCC) features from MDCT spectrum in AAC domain for audio content analysis. In particular, a MFCC extraction method is proposed, which is adaptive to the window switch in AAC encoding process, and independent of the audio sampling frequency. We discuss the fusion method of MFCC features from different window type in order to keep the balance of the frequency and temporal resolution. The audio scene segmentation and audio classification experimental results show that such approach based on compression domain can approach the performance of the system based on PCM audio, and the CPU overload decreased dramatically. It is meaningful to the real-time analysis of audio content.
  • HELICOBACTER PYLORI INFECTION DETECTION FROM MULTIPLE X-RAY IMAGES BASED ON DECISION LEVEL FUSION
    Kenta Ishihara, Takahiro Ogawa, Miki Haseyama
    2014 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 2769, 2773, IEEE, 2014年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an automatic detection method of Helicobacter pylori (H. pylori) infection from multiple gastric X-ray images. As the biggest contribution of this paper, we combine multiple detection results based on a decision level fusion. In order to obtain multiple detection results, the proposed method first focuses on characteristics of gastric X-ray images with H. pylori infection and computes several visual features from multiple X-ray images taken in several specific directions. Second, we select effective features for H. pylori infection detection from all features based on the minimal-Redundancy-Maximal-Relevance algorithm, and the selected features are used to train the Support Vector Machine (SVM) classifiers that are constructed for each direction of gastric radiography. Therefore, the detection of H. pylori infection becomes feasible, and we can obtain multiple detection results from the SVM classifiers. Furthermore, we combine multiple detection results based on the decision level fusion scheme considering the detection performance of each SVM classifier. Experimental results obtained by applying the proposed method to real X-ray images prove the effectiveness of the proposed method.
  • 2D SEMI-SUPERVISED CCA-BASED INPAINTING INCLUDING NEW PRIORITY ESTIMATION
    Takahiro Ogawa, Miki Haseyama
    2014 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 1837, 1841, IEEE, 2014年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an inpainting method based on 2D semi-supervised canonical correlation analysis (2D semi-CCA) including new priority estimation. The proposed method estimates relationship, i.e., the optimal correlation, between missing area and its neighboring area from known parts within the target image by using 2D CCA. In this approach, we newly introduce a semi-supervised scheme into the 2D CCA for deriving the 2D semi-CCA which corresponds to a hybrid version of 2D CCA and 2D principle component analysis (2D PCA). This enables successful relationship estimation even if sufficient number of training pairs cannot be provided. Then, by using the obtained relationship, accurate estimation of the missing intensities can be realized. Furthermore, in the proposed method, errors caused in the new variate space obtained by the 2D semi-CCA are effectively used for deriving patch priority determining inpainting order of missing areas. Experimental results show our inpainting method can outperform previously reported methods.
  • NOVEL IMAGE CLASSIFICATION BASED ON DECISION-LEVEL FUSION OF EEG AND VISUAL FEATURES
    Takuya Kawakami, Takahiro Ogawa, Miki Haseyama
    2014 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 5874, 5878, IEEE, 2014年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel image classification based on decision-level fusion of EEG and visual features. In the proposed method, we extract the EEG features from EEG signals recorded while users stare at images, and the visual features are computed from these images. Then the classification of images is performed based on Support Vector Machine (SVM) by separately using the EEG and visual features. Furthermore, we merge the above classification results based on Supervised Learning from Multiple Experts to obtain the final classification result. This method focuses on the classification accuracy calculated from each classification result. Therefore, although classification accuracy based on EEG and visual features are different from each other, our method realizes effective integration of these classification results. In addition, we newly derive a kernelized version of the method in order to realize more accurate integration of the classification results. Consequently, our method realizes successful multimodal classification of images by the object categories that they contain.
  • MISSING INTENSITY RESTORATION VIA PERCEPTUALLY OPTIMIZED SUBSPACE PROJECTION BASED ON ENTROPY COMPONENT ANALYSIS
    Takahiro Ogawa, Miki Haseyama
    2014 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 175, 179, IEEE, 2014年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A missing intensity restoration method via perceptually optimized subspace projection based on entropy component analysis (ECA) is presented in this paper. The proposed method calculates the optimal subspace of known patches within a target image based on structural similarity (SSIM) index, and the optimal bases are determined based on ECA. Then missing intensity estimation whose results maximize the SSIM index is realized by using a projection onto convex sets (POCS) algorithm whose constraints are the obtained subspace and known intensities within the target image. In this approach, a non-convex maximization problem for calculating the projection onto the subspace is reformulated as a quasi-convex problem, and the restoration of the missing intensities becomes feasible. Experimental results show that our restoration method outperforms previously reported methods.
  • Image inpainting based on sparse representations with a perceptual metric
    Takahiro Ogawa, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2013, 179, 179, SPRINGER INTERNATIONAL PUBLISHING AG, 2013年12月, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents an image inpainting method based on sparse representations optimized with respect to a perceptual metric. In the proposed method, the structural similarity (SSIM) index is utilized as a criterion to optimize the representation performance of image data. Specifically, the proposed method enables the formulation of two important procedures in the sparse representation problem, 'estimation of sparse representation coefficients' and 'update of the dictionary', based on the SSIM index. Then, using the generated dictionary, approximation of target patches including missing areas via the SSIM-based sparse representation becomes feasible. Consequently, image inpainting for which procedures are totally derived from the SSIM index is realized. Experimental results show that the proposed method enables successful inpainting of missing areas.
  • Exploring and visualizing tag relationships in photo sharing websites based on distributional representations
    Marie Katsurai, Miki Haseyama
    ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 3617, 3621, IEEE, 2013年10月18日, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method for exploring and visualizing tag relationships in photo sharing websites based on distributional representations of tags. First, we find a representative distribution of a tag, which is summarized by the mean and covariance, using features of tagged photos. This distributional representation can jointly consider the semantic meaning of tags and their abstraction levels. Then, based on the representative distributions, we derive two kinds of semantic measures on tag relationships. The extracted information is visualized in a graphical network to facilitate the understanding of tag usage. Experiments conducted using tagged photos collected from Flickr show that our tag network is more coherent to human cognition than other networks constructed by conventional methods. © 2013 IEEE.
  • Vocal segment estimation in music pieces based on collaborative use of EEG and audio features
    Takuya Kawakami, Takahiro Ogawa, Miki Haseyama
    ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 1197, 1201, IEEE, 2013年10月18日, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel estimation method of segments including vocals in music pieces based on collaborative use of features extracted from electroencephalogram (EEG) signals recorded while users are listening to music pieces and features extracted from these audio signals. From extracted EEG features and audio features, we estimate segments including vocals based on Support Vector Machine (SVM) by separately utilizing these two features. Furthermore, the final classification results are obtained by integrating these estimation results based on supervised learning from multiple experts. Therefore, our method realizes multimodal estimation of segments including vocals in music pieces. Experimental results show the improvement of our method over the methods utilizing only EEG or audio features. © 2013 IEEE.
  • 胃X線検査における胃背景粘膜の自動解析による胃がんリスク評価の検討
    間部克裕, 長谷山美紀, 小川貴弘, 吉澤和哉, 大泉晴史, 中島滋美, 加藤元嗣
    日本消化器がん検診学会雑誌, 51, 3, 96, 2013年05月15日
    日本語
  • レベルセット法を用いたサッカー映像における選手追跡手法(画像認識,コンピュータビジョン,<特集>学生論文)
    高橋 翔, 林 原局, 長谷山 美紀
    電子情報通信学会論文誌. D, 情報・システム, 96, 3, 695, 703, 一般社団法人電子情報通信学会, 2013年03月, [査読有り]
    日本語, 本論文では,サッカー映像からレベルセット法を用いて選手を追跡する手法を提案する.提案手法では,サッカー映像を各フレームが時間軸方向に重なるように連結した三次元データとして扱う.このデータに対して,レベルセット法を適用することで抽出される三次元の領域は,複数フレームに渡って存在する同一選手を包含する.提案手法では,この三次元の領域をサッカー映像から抽出することで,選手の追跡を実現する.したがって,提案手法では,フレームごとに選手を検出する必要がないため,フレームを個別に処理する従来手法における選手の検出と追跡それぞれの誤差によって精度が低下する問題を解決可能である.また,我々は,ユニフォームの色成分をサッカー映像から色コリログラムを用いて推定し,これをレベルセット法を用いて追跡する選手の特徴として導入する.これにより,提案手法では,追跡対象の特徴を事前に与えることなく,選手の頑健な追跡が可能となる.本文の最後では,実際にテレビで放送されたサッカー映像に対する実験により,提案手法の有効性を確認する.
  • Missing Texture Reconstruction Method Based on Error Reduction Algorithm Using Fourier Transform Magnitude Estimation Scheme
    Takahiro Ogawa, Miki Haseyama
    IEEE TRANSACTIONS ON IMAGE PROCESSING, 22, 3, 1252, 1257, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2013年03月, [査読有り]
    英語, 研究論文(学術雑誌), A missing texture reconstruction method based on an error reduction (ER) algorithm, including a novel estimation scheme of Fourier transform magnitudes is presented in this brief. In our method, Fourier transform magnitude is estimated for a target patch including missing areas, and the missing intensities are estimated by retrieving its phase based on the ER algorithm. Specifically, by monitoring errors converged in the ER algorithm, known patches whose Fourier transform magnitudes are similar to that of the target patch are selected from the target image. In the second approach, the Fourier transform magnitude of the target patch is estimated from those of the selected known patches and their corresponding errors. Consequently, by using the ER algorithm, we can estimate both the Fourier transform magnitudes and phases to reconstruct the missing areas.
  • Super-resolution for simultaneous realization of resolution enhancement and motion blur removal based on adaptive prior settings
    Takahiro Ogawa, Daisuke Izumi, Akane Yoshizaki, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2013, 1, 17, SPRINGER INTERNATIONAL PUBLISHING AG, 2013年02月, [査読有り]
    英語, 研究論文(学術雑誌), A super-resolution method for simultaneously realizing resolution enhancement and motion blur removal based on adaptive prior settings are presented in this article. In order to obtain high-resolution (HR) video sequences from motion-blurred low-resolution video sequences, both of the resolution enhancement and the motion blur removal have to be performed. However, if one is performed after the other, errors in the first process may cause performance deterioration of the subsequent process. Therefore, in the proposed method, a new problem, which simultaneously performs the resolution enhancement and the motion blur removal, is derived. Specifically, a maximum a posterior estimation problem which estimates original HR frames with motion blur kernels is introduced into our method. Furthermore, in order to obtain the posterior probability based on Bayes' rule, a prior probability of the original HR frame, whose distribution can adaptively be set for each area, is newly defined. By adaptively setting the distribution of the prior probability, preservation of the sharpness in edge regions and suppression of the ringing artifacts in smooth regions are realized. Consequently, based on these novel approaches, the proposed method can perform successful reconstruction of the HR frames. Experimental results show impressive improvements of the proposed method over previously reported methods.
  • Active grid-based method for visualizing pass regions in soccer videos
    Sho Takahashi, Miki Haseyama
    Electronic Proceedings of the 2013 IEEE International Conference on Multimedia and Expo Workshops, ICMEW 2013, 1, 6, IEEE, 2013年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method for visualizing pass regions that have high probabilities of the pass succeeding from broadcast soccer videos. In soccer matches, players discover pass regions based on player position geometry and player velocities. Therefore, by using player position geometry and player velocities, which are obtained from a broadcast soccer video, we can visualize pass regions. The proposed method is realized by the following two steps. 1) Generation of new three-dimensional data (volume data) for analyzing pass regions, which are not visible. 2) Visualization of pass regions. In the first step, volume data are generated from player position geometry and player velocities. By generating the volume data, which express the player position geometry and the player velocities, analysis of invisible pass regions is enabled. In the second step, by applying Active grid to the generated volume data, pass regions are visualized. Specifically, lattice points of the Active grid converge to the pass regions. Therefore, positions of the pass regions on the pitch can be visualized from densities of the lattice points. In the experiment, the proposed method is applied to actual TV programs to verify its effectiveness. © 2013 IEEE.
  • An extraction method of hierarchical Web communities for Web video retrieval
    Ryosuke Harakawa, Yasutaka Hatakeyama, Takahiro Ogawa, Miki Haseyama
    2013 IEEE International Conference on Image Processing, ICIP 2013 - Proceedings, 4397, 4401, IEEE, 2013年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an extraction method of hierarchical Web communities for Web video retrieval. In the proposed method, Web communities containing Web videos whose topics are similar to each other are extracted by using hyperlinks between Web pages including Web videos and their video features. Furthermore, we focus on graph structure of hyperlinks between Web pages including Web videos which belong to the Web communities. Then, by using strongly connected components and betweenness centrality of the graph, hierarchical structure of the Web communities can be estimated. Consequently, users can easily find Web videos including related topics in each hierarchy, and desired Web videos can be effectively retrieved. © 2013 IEEE.
  • Insect classification using Scanning Electron Microphotographs considering magnifications
    Akihiro Takahashi, Takahiro Ogawa, Miki Haseyama
    2013 IEEE International Conference on Image Processing, ICIP 2013 - Proceedings, 3269, 3273, IEEE, 2013年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method of insect classification using images taken by Scanning Electron Microscope (SEM) considering magnifications. Generally, when images of the same insects are taken by SEM with different magnifications, visual features of these images are different from each other. Thus, the proposed method adopts a new scheme which groups images of different magnifications in such a way that the classification performance becomes the highest. Then a classifier is constructed for each group, and the insect classification becomes feasible based on a target image magnification. In addition, by integrating the classification results of several images obtained from the same sample, i.e., the same insect, performance improvement of the insect classification considering magnifications can be realized. Experimental results show the effectiveness of the proposed method. © 2013 IEEE.
  • SPECTRAL REFLECTANCE ESTIMATION FROM VISIBLE LIGHT COMPONENTS AND NEAR-INFRARED COMPONENTS
    Yuta Igarashi, Takahiro Ogawa, Miki Haseyama
    2013 20TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2013), 2388, 2392, IEEE, 2013年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a novel method for estimating a spectral reflectance from two kinds of input images: an image including both visible light components and near-infrared (NIR) components, and an image including only NIR components. From these input images, we estimate the spectral reflectance based on the Non-negative Matrix Factorization algorithm using spectral sensitivities of a digital camera. The estimated spectral reflectance enables several important applications. In this paper, the e ff ectiveness of the proposed method is verified by using the estimated spectral reflectance in the two image processing applications.
  • KCFA-BASED MISSING AREA RESTORATION INCLUDING NEW PRIORITY ESTIMATION
    Takahiro Ogawa, Miki Haseyama
    2013 20TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP 2013), 704, 708, IEEE, 2013年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A kernel cross-modal factor analysis (KCFA) based missing area restoration method including a new priority estimation scheme is presented in this paper. The proposed method estimates latent relationship between missing areas and their neighboring areas by deriving projection matrices minimizing their errors in the latent space based on KCFA. This latent relationship represented by the derived projection matrices is optimal for accurately restoring missing areas within the target image. Furthermore, the proposed method adopts a new priority estimation scheme which determines the restoration order of missing areas. Specifically, this priority is estimated based on the criterion representing the restoration performance derived from KCFA, and it enables adaptive selection of missing areas successfully restored by our method. Consequently, it becomes feasible to accurately perform the restoration of missing areas by using the proposed KCFA-based method. Experimental results show subjective and quantitative improvements of the proposed method over previously reported restoration methods.
  • Trial Realization of Human-Centered Multimedia Navigation for Video Retrieval
    Miki Haseyama, Takahiro Ogawa
    INTERNATIONAL JOURNAL OF HUMAN-COMPUTER INTERACTION, 29, 2, 96, 109, TAYLOR & FRANCIS INC, 2013年01月, [査読有り]
    英語, 研究論文(学術雑誌), A trial realization of human-centered navigation for video retrieval is presented in this article. This system consists of the following functions: (a) multimodal analysis for collaborative use of multimedia data, (b) preference extraction for the system to adapt to users' individual demands, and (c) adaptive visualization for users to be guided to their desired contents. By using these functions, users can find their desired video contents more quickly and accurately than with the conventional retrieval schemes since our system can provide new pathways to the desired contents. Experimental results verify the effectiveness of the proposed system.
  • 車載複数カメラによる夜間雨天時における路面反射グレア領域の検出と画像改善
    公文宏明, 長谷山美紀
    映像情報メディア学会誌(Web), 67, 3, 2013年
  • Performance of Spatial and Temporal Error Concealment Method for 3D DWT Video Coding in Packet Loss Channel
    Hirokazu Tanaka, Sunmi Kim, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E95A, 11, 2015, 2022, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2012年11月, [査読有り]
    英語, 研究論文(学術雑誌), A new spatial and temporal error concealment method for three-dimensional discrete wavelet transform (3D DWT) video coding is analyzed. 3D DWT video coding employing dispersive grouping (DG) and two-step error concealment is an efficient method in a packet loss channel [20], [21]. In the two-step error concealment method, the interpolations are only spatially applied however, higher efficiency of the interpolation can be expected by utilizing spatial and temporal similarities. In this paper, we propose an enhanced spatial and temporal error concealment method in order to achieve higher error concealment (EC) performance in packet loss networks. In the temporal error concealment method, structural similarity (SSIM) index is employed for inter group of pictures (GOP) EC and minimum mean square error (MMSE) is used for intra GOP EC. Experimental results show that the proposed method can obtain remarkable performance compared with the conventional methods.
  • Super-Resolution Reconstruction for Spatio-Temporal Resolution Enhancement of Video Sequences
    Miki Haseyama, Daisuke Izumi, Makoto Takizawa
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E95D, 9, 2355, 2358, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2012年09月, [査読有り]
    英語, 研究論文(学術雑誌), A method for spatio-temporal resolution enhancement of video sequences based on super-resolution reconstruction is proposed. A new observation model is defined for accurate resolution enhancement, which enables subpixel motion in intermediate frames to be obtained. A modified optimization formula for obtaining a high-resolution sequence is also adopted.
  • 回路理論における伝送と振動(第7回)インピーダンス変成比をもつ帯域通過フィルタ
    永井 信夫, 任 捷, 長谷山 美紀
    信号処理, 16, 5, 359, 368, [信号処理学会], 2012年09月
    日本語
  • 回路理論における伝送と振動(第6回)回路理論に基づく左手系回路の再考
    永井 信夫, 任 捷, 長谷山 美紀
    信号処理, 16, 4, 263, 272, [信号処理学会], 2012年07月
    日本語
  • A Novel Framework for Extracting Visual Feature-Based Keyword Relationships from an Image Database
    Marie Katsurai, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E95A, 5, 927, 937, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2012年05月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a novel framework for extracting visual feature-based keyword relationships from an image database is proposed. From the characteristic that a set of relevant keywords tends to have common visual features, the keyword relationships in a target image database are extracted by using the following two steps. First, the relationship between each keyword and its corresponding visual features is modeled by using a classifier. This step enables detection of visual features related to each keyword. In the second step, the keyword relationships are extracted from the obtained results. Specifically, in order to measure the relevance between two keywords, the proposed method removes visual features related to one keyword from training images and monitors the performance of the classifier obtained for the other keyword. This measurement is the biggest difference from other conventional methods that focus on only keyword co-occurrences or visual similarities. Results of experiments conducted using an image database showed the effectiveness of the proposed method.
  • 回路理論における伝送と振動(第5回)差分方程式の拡張による1次元格子および左手系回路
    永井 信夫, 任 捷, 長谷山 美紀
    信号処理, 16, 3, 187, 196, [信号処理学会], 2012年05月
    日本語
  • 講義シリーズ 回路理論における伝送と振動(第4回)影像位相がπ/2で生じる固有振動と共鳴
    永井 信夫, 任 捷, 長谷山 美紀
    信号処理, 16, 2, 101, 110, [信号処理学会], 2012年03月
    日本語
  • 研究室紹介 長谷山研究室(北海道大学大学院情報科学研究科)
    長谷山 美紀
    信号処理, 16, 2, 121, 126, [信号処理学会], 2012年03月
    日本語
  • 顕微鏡画像を用いたSVDDによる深海底生物の分類体系の推定法
    長谷川尭史, 小川貴弘, 渡邉日出海, 長谷山美紀
    電子情報通信学会技術研究報告, 111, 442(IE2011 105-132), 73, 78, 2012年02月
    日本語
  • A cross-modal approach for extracting semantic relationships of concepts from an image database
    Marie Katsurai, Takahiro Ogawa, Miki Haseyama
    ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 2373, 2376, IEEE, 2012年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a cross-modal approach for extracting semantic relationships of concepts from an image database. First, canonical correlation analysis (CCA) is used to capture the cross-modal correlations between visual features and tag features in the database. Then, in order to measure inter-concept relationships and estimate semantic levels, the proposed method focuses on the distributions of images under the probabilistic interpretation of CCA. Results of experiments conducted by using an image database showed the improvement of the proposed method over existing methods. © 2012 IEEE.
  • PERCEPTUALLY OPTIMIZED SUBSPACE ESTIMATION FOR MISSING TEXTURE RECONSTRUCTION
    Takahiro Ogawa, Miki Haseyama
    2012 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP), 1141, 1144, IEEE, 2012年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a perceptually optimized subspace estimation method for missing texture reconstruction. The proposed method calculates the optimal subspace of known patches within a target image based on structural similarity (SSIM) index instead of calculating mean square error (MSE)-based eigenspace. Furthermore, from the obtained subspace, missing texture reconstruction whose results maximize the SSIM index is performed. In this approach, the non-convex maximization problem is reformulated as a quasi convex problem, and the reconstruction of the missing textures becomes feasible. Experimental results show that our method overcomes previously reported MSE-based reconstruction methods.
  • 回路理論における伝送と振動(第3回)連成振動とその拡張に関係する固有振動
    永井 信夫, 任 捷, 長谷山 美紀
    信号処理, 16, 1, 13, 22, [信号処理学会], 2012年01月
    日本語
  • 8-3 選手の移動速度を考慮したサッカー映像における3次元パス可能領域の推定に関する検討(第8部門 メディア工学3)
    高橋 翔, 長谷山 美紀
    映像情報メディア学会冬季大会講演予稿集, 2012, 8, 3-1, 一般社団法人 映像情報メディア学会, 2012年
    日本語, This paper realizes an improvement of 3D pass region estimation method by using player velocity in soccer videos. In the previous method, since the pass region was estimated regardless of player velocity, the accuracy was limited. Therefore, by introducing the player velocity to the pass region estimation, we improve the performance of the previous method.
  • SVDDを用いた顕微鏡画像からの新種深海底生物の検出および分類体系上の位置の推定法
    長谷川尭史, 小川貴弘, 渡邉日出海, 長谷山美紀
    映像情報メディア学会誌(Web), 66, 7, 2012年
  • Missing Image Data Reconstruction Based on Adaptive Inverse Projection via Sparse Representation
    Takahiro Ogawa, Miki Haseyama
    IEEE TRANSACTIONS ON MULTIMEDIA, 13, 5, 974, 992, IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 2011年10月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a missing image data reconstruction method based on an adaptive inverse projection via sparse representation is proposed. The proposed method utilizes sparse representation for obtaining low-dimensional subspaces that approximate target textures including missing areas. Then, by using the obtained low-dimensional subspaces, inverse projection for reconstructing missing areas can be derived to solve the problem of not being able to directly estimate missing intensities. Furthermore, in this approach, the proposed method monitors errors caused by the derived inverse projection, and the low-dimensional subspaces optimal for target textures are adaptively selected. Therefore, we can apply adaptive inverse projection via sparse representation to target missing textures, i.e., their adaptive reconstruction becomes feasible. The proposed method also introduces some schemes for color processing into the calculation of subspaces on the basis of sparse representation and attempts to avoid spurious color caused in the reconstruction results. Consequently, successful reconstruction of missing areas by the proposed method can be expected. Experimental results show impressive improvement of our reconstruction method over previously reported reconstruction methods.
  • Cross Low-Dimension Pursuit for Sparse Signal Recovery from Incomplete Measurements Based on Permuted Block Diagonal Matrix
    Zaixing He, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E94A, 9, 1793, 1803, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2011年09月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a novel algorithm, Cross Low-dimension Pursuit, based on a new structured sparse matrix, Permuted Block Diagonal (PBD) matrix, is proposed in order to recover sparse signals from incomplete linear measurements. The main idea of the proposed method is using the PBD matrix to convert a high-dimension sparse recovery problem into two (or more) groups of highly low-dimension problems and crossly recover the entries of the original signal from them in an iterative way. By sampling a sufficiently sparse signal with a PBD matrix, the proposed algorithm can recover it efficiently. It has the following advantages over conventional algorithms: (1) low complexity, i.e., the algorithm has linear complexity, which is much lower than that of existing algorithms including greedy algorithms such as Orthogonal Matching Pursuit and (2) high recovery ability, i.e., the proposed algorithm can recover much less sparse signals than even l(1)-norm minimization algorithms. Moreover, we demonstrate both theoretically and empirically that the proposed algorithm can reliably recover a sparse signal from highly incomplete measurements.
  • 回路理論における伝送と振動(第2回)2種類の原子からなる1次元格子の固有振動と共鳴
    永井 信夫, 任 捷, 長谷山 美紀
    信号処理, 15, 5, 331, 340, 〔信号処理学会〕, 2011年09月
    日本語
  • Adaptive Single Image Superresolution Approach Using Support Vector Data Description
    Takahiro Ogawa, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2011, SPRINGER INTERNATIONAL PUBLISHING AG, 2011年, [査読有り]
    英語, 研究論文(学術雑誌), An adaptive single image superresolution (SR) method using a support vector data description (SVDD) is presented. The proposed method represents the prior on high-resolution (HR) images by hyperspheres of the SVDD obtained from training examples and reconstructs HR images from low-resolution (LR) observations based on the following schemes. First, in order to perform accurate reconstruction of HR images containing various kinds of objects, training HR examples are previously clustered based on the distance from a center of a hypersphere obtained for each cluster. Furthermore, missing high-frequency components of the target image are estimated in order that the reconstructed HR image minimizes the above distances. In this approach, the minimized distance obtained for each cluster is utilized as a criterion to select the optimal hypersphere for estimating the high-frequency components. This approach provides a solution to the problem of conventional methods not being able to perform adaptive estimation of the high-frequency components. In addition, local patches in the target low-resolution (LR) image are utilized as the training HR examples from the characteristic of self-similarities between different resolution levels in general images, and our method can perform the SR without utilizing any other HR images.
  • ADAPTIVE KPCA-BASED MISSING TEXTURE RECONSTRUCTION APPROACH INCLUDING CLASSIFICATION SCHEME VIA DIFFERENCE SUBSPACES
    Takahiro Ogawa, Miki Haseyama
    2011 18TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), 1133, 1136, IEEE, 2011年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an adaptive kernel principal component analysis (KPCA) based missing texture reconstruction approach including a classification scheme via difference subspaces. The proposed method utilizes a KPCA-based nonlinear eigenspace, which is obtained from each kind of known texture within a target image, as a constraint for reconstructing missing textures with a constraint of known neighboring areas. Then since these two constraints are convex, we can estimate missing textures based on a projection onto convex sets (POCS) algorithm. Furthermore, in this approach, the proposed method derives a new criterion for selecting the optimal eigenspace by monitoring errors caused in the projection via a difference subspace of each kind of known texture. This provides a solution to conventional problems of not being able to perform accurate texture classification, and the adaptive reconstruction of missing textures can be realized by the proposed method. Experimental results show subjective and quantitative improvement of the proposed method over previously reported reconstruction methods.
  • LINEAR TIME DECODING OF REAL-FIELD CODES OVER HIGH ERROR RATE CHANNELS
    Zaixing He, Takahiro Ogawa, Miki Haseyama
    2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 3172, 3175, IEEE, 2011年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a novel algorithm for decoding real-field codes over erroneous channels, where the encoded message is corrupted by sparse errors, i.e., impulsive noise. The main problem of decoding such a corrupted encoded message is to reconstruct the error vector; recently, a common way to reconstruct it is to find the sparsest solution to an underdetermined system that is constructed using a parity-check matrix. Unlike the conventional approaches reconstructing the high-dimensional error vector directly, the proposed method crossly recovers the elements of error vector from two (or several) groups of low-dimensional equations. Compared with the traditional algorithms, the proposed method can decode an encoded message with a much higher corruption rate. Furthermore, the complexity of our method is linear, which is much lower than those of the traditional methods. The experimental results verified the high error correction ability and speed of the proposed method.
  • ADAPTIVE RECONSTRUCTION METHOD OF MISSING TEXTURES BASED ON PERCEPTUALLY OPTIMIZED ALGORITHM
    Takahiro Ogawa, Miki Haseyama
    2011 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 1157, 1160, IEEE, 2011年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an adaptive reconstruction method of missing textures based on structural similarity (SSIM) index. The proposed method firstly performs SSIM-based selection of the optimal known local textures to adaptively obtain subspaces for reconstructing missing textures. Furthermore, from the selected known textures, the missing texture reconstruction maximizing the SSIM index is performed. In this approach, the non-convex maximization problem is reformulated as a quasi convex problem, and the adaptive reconstruction of the missing textures becomes feasible. Experimental results show impressive improvement of the proposed method over previously reported reconstruction methods.
  • Adaptive example-based super-resolution using kernel PCA with a novel classification approach
    Takahiro Ogawa, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2011, 1, 29, SPRINGER INTERNATIONAL PUBLISHING AG, 2011年, [査読有り]
    英語, 研究論文(学術雑誌), An adaptive example-based super-resolution (SR) using kernel principal component analysis (PCA) with a novel classification approach is presented in this paper. In order to enable estimation of missing high-frequency components for each kind of texture in target low-resolution (LR) images, the proposed method performs clustering of high-resolution (HR) patches clipped from training HR images in advance. Based on two nonlinear eigenspaces, respectively, generated from HR patches and their corresponding low-frequency components in each cluster, an inverse map, which can estimate missing high-frequency components from only the known low-frequency components, is derived. Furthermore, by monitoring errors caused in the above estimation process, the proposed method enables adaptive selection of the optimal cluster for each target local patch, and this corresponds to the novel classification approach in our method. Then, by combining the above two approaches, the proposed method can adaptively estimate the missing high-frequency components, and successful reconstruction of the HR image is realized.
  • Music recommendation according to human motion based on kernel CCA-based relationship
    Hiroyuki Ohkushi, Takahiro Ogawa, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2011, 121, 121, SPRINGER INTERNATIONAL PUBLISHING AG, 2011年, [査読有り]
    英語, 研究論文(学術雑誌), In this article, a method for recommendation of music pieces according to human motions based on their kernel canonical correlation analysis (CCA)-based relationship is proposed. In order to perform the recommendation between different types of multimedia data, i.e., recommendation of music pieces from human motions, the proposed method tries to estimate their relationship. Specifically, the correlation based on kernel CCA is calculated as the relationship in our method. Since human motions and music pieces have various time lengths, it is necessary to calculate the correlation between time series having different lengths. Therefore, new kernel functions for human motions and music pieces, which can provide similarities between data that have different time lengths, are introduced into the calculation of the kernel CCA-based correlation. This approach effectively provides a solution to the conventional problem of not being able to calculate the correlation from multimedia data that have various time lengths. Therefore, the proposed method can perform accurate recommendation of best matched music pieces according to a target human motion from the obtained correlation. Experimental results are shown to verify the performance of the proposed method.
  • 足跡を用いた男女識別               
    画像ラボ, 22, 1, 17, 21, 2011年
  • 固有空間BPLP法の補間精度に関する解析
    田中章, 小川貴弘, 長谷山美紀, 宮腰政明
    電子情報通信学会 論文誌(A), J94-A, 2, 116, 126, 2011年
  • Error-Resilient 3-D Wavelet Video Coding with Duplicated Lowest Sub-Band Coefficients and Two-Step Error Concealment Method
    Sunmi Kim, Hirokazu Tanaka, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E93A, 11, 2173, 2183, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2010年11月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper we propose a two step error concealment algorithm based on an error resilient three dimensional discrete wavelet transform (3 D DWT) video coding scheme. The proposed scheme consists of an error resilient encoder duplicating the lowest sub band bit streams for dispersive grouped frames and an error concealment decoder. The error concealment method of this decoder is decomposed of two steps the first step is replacement of erroneous coefficients in the lowest sub band by the duplicated coefficients and the second step is interpolation of the missing wavelet coefficients by minimum mean square error (MMSE) estimation. The proposed scheme can achieve robust transmission over unreliable channels. Experimental results provide performance comparisons in terms of peak signal to noise ratio (PSNR) and demonstrate increased performances compared to state of the art error concealment schemes.
  • 画像・映像意味理解の現状と検索インタフェース(<小特集>ビジョンコンピューティングにおける確率的情報処理の展開)
    長谷山 美紀
    電子情報通信学会誌, 93, 9, 764, 769, 一般社団法人電子情報通信学会, 2010年09月
    日本語, 画像・映像意味理解の研究動向とその検索への応用について紹介する.更に,画像及び映像が持つ固有の多義性とあいまい性から検索結果の可視化システムの必要性を議論し,その実現の試みについて紹介するとともに今後の展開について考える.
  • SVMを用いた足跡からの男女識別の実現(研究速報)
    浅水 仁, 長谷山 美紀
    電子情報通信学会論文誌. D, 情報・システム, 93, 5, 642, 646, 一般社団法人電子情報通信学会, 2010年05月01日
    日本語, 本論文では,施設や店舗などに出入りする人物の足跡を用いて男女識別する手法について検証する.取得した足跡から算出が可能な特徴量を用いてSVMにより男女を識別する.本手法を用いて被験者実験を行い,90%の識別率を実現した.
  • ADAPTIVE RECONSTRUCTION METHOD OF MISSING TEXTURES BASED ON INVERSE PROJECTION VIA SPARSE REPRESENTATION
    Takahiro Ogawa, Miki Haseyama
    2010 IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO (ICME 2010), 352, 357, IEEE, 2010年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents an adaptive reconstruction method of missing textures based on an inverse projection via sparse representation. The proposed method approximates original and corrupted textures in lower-dimensional subspaces by using the sparse representation technique. Then, this approach effectively solves problems of not being able to directly estimate an inverse projection for reconstructing missing textures. Furthermore, even if target textures contain missing areas, the proposed method enables adaptive generation of the subspaces by monitoring errors caused in their known neighboring textures by the estimated inverse projection. Consequently, since the optimal inverse projection is adaptively estimated for each texture, successful reconstruction of the missing areas can be expected. Experimental results show impressive improvement of the proposed reconstruction technique over previously reported reconstruction techniques.
  • THE SIMPLEST MEASUREMENT MATRIX FOR COMPRESSED SENSING OF NATURAL IMAGES
    Zaixing He, Takahiro Ogawa, Miki Haseyama
    2010 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, 4301, 4304, IEEE, 2010年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), There exist two main problems in currently existing measurement matrices for compressed sensing of natural images, the difficulty of hardware implementation and low sensing efficiency. In this paper, we present a novel simple and efficient measurement matrix, Binary Permuted Block Diagonal (BPBD) matrix. The BPBD matrix is binary and highly sparse (all but one or several "1"s in each column are "0"s). Therefore, it can simplify the compressed sensing procedure dramatically. The proposed measurement matrix has the following advantages, which cannot be entirely satisfied by existing measurement matrices. (1) It has easy hardware implementation because of the binary elements; (2) It has high sensing efficiency because of the highly sparse structure; (3) It is incoherent with different popular sparsity basis' like wavelet basis and gradient basis; (4) It provides fast and nearly optimal reconstructions. Moreover, the simulation results demonstrate the advantages of the proposed measurement matrix.
  • Spatio-temporal resolution enhancement of video sequence based on super-resolution reconstruction.
    Miki Haseyama, Daisuke Izumi, Makoto Takizawa
    Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2010, 14-19 March 2010, Sheraton Dallas Hotel, Dallas, Texas, USA, 870, 873, IEEE, 2010年, [査読有り]
    研究論文(国際会議プロシーディングス)
  • A Genetic Algorithm for Generating Multiple Paths on Mesh Maps
    Jun Inagaki, Tomoaki Shirakawa, Tetsuo Shimono, Miki Haseyama
    2010 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION (CEC), 1, 4, IEEE, 2010年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), Path generation is an optimization problem mainly performed on grid square maps that combines generation of paths with minimization of their cost. Several methods that belong to the class of exhaustive searches are available; however, these methods are only able to obtain a single path as a solution for each iteration of the search. Hence, this paper proposes a new method using genetic algorithms for this problem with the goal of simultaneously searching for multiple candidate paths.
  • Missing Texture Reconstruction Method Based on Perceptually Optimized Algorithm
    Takahiro Ogawa, Miki Haseyama
    EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, 2010, HINDAWI PUBLISHING CORPORATION, 2010年, [査読有り]
    英語, 研究論文(学術雑誌), This paper presents a simple and effective missing texture reconstruction method based on a perceptually optimized algorithm. The proposed method utilizes the structural similarity (SSIM) index as a new visual quality measure for reconstructing missing areas. Furthermore, in order to adaptively reconstruct target images containing several kinds of textures, the following two novel approaches are introduced into the SSIM-based reconstruction algorithm. First, the proposed method performs SSIM-based selection of the optimal known local textures to adaptively obtain subspaces for reconstructing missing textures. Secondly, missing texture reconstruction that maximizes the SSIM index in the known neighboring areas is performed. In this approach, the nonconvex maximization problem is reformulated as a quasi convex problem, and adaptive reconstruction of the missing textures based on the perceptually optimized algorithm becomes feasible. Experimental results show impressive improvements of the proposed method over previously reported reconstruction methods.
  • Erratum: Error-Resilient 3-D Wavelet Video Coding with Duplicated Lowest Sub-Band Coefficients and Two-Step Error Concealment Method [IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences E93.A (2010) , No. 11 pp.2173-2183]
    KIM Sunmi, TANAKA Hirokazu, OGAWA Takahiro, HASEYAMA Miki
    IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, 93, 12, 2763_e1, 2763_e1, The Institute of Electronics, Information and Communication Engineers, 2010年
    英語
  • Adaptive Missing Texture Reconstruction Method Based on Kernel Canonical Correlation Analysis with a New Clustering Scheme
    Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 8, 1950, 1960, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2009年08月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a method for adaptive reconstruction of missing textures based on kernel canonical correlation analysis (CCA) with a new clustering scheme is presented. The proposed method estimates the correlation between two areas, which respectively correspond to a missing area and its neighboring area, from known parts within the target image and realizes reconstruction of the missing texture. In order to obtain this correlation, the kernel CCA is applied to each cluster containing the same kind of textures, and the optimal result is selected for the target missing area. Specifically, a new approach monitoring errors caused in the above kernel CCA-based reconstruction process enables selection of the optimal result. This approach provides a solution to the problem in traditional methods of not being able to perform adaptive reconstruction of the target textures due to missing intensities. Consequently, all of the missing textures are successfully estimated by the optimal cluster's correlation, which provides accurate reconstruction of the same kinds of textures. In addition, the proposed method can obtain the correlation more accurately than our previous works, and more successful reconstruction performance can be expected. Experimental results show impressive improvement of the proposed reconstruction technique over previously reported reconstruction techniques.
  • An ER Algorithm-Based Method for Removal of Adherent Water Drops from Images Obtained by a Rear View Camera Mounted on a Vehicle in Rainy Conditions
    Tomoki Hiramatsu, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 8, 1939, 1949, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2009年08月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, an ER (Error-Reduction) algorithm-based method for removal of adherent water drops from images obtained by a rear view camera mounted on a vehicle in rainy conditions is proposed. Since Fourier-domain and object-domain constraints are needed for any ER algorithm-based method, the proposed method introduces the following two novel constraints for the removal of adherent water drops. The first one is the Fourier-domain constraint that utilizes the Fourier transform magnitude of the previous frame in the obtained images as that of the target frame. Noting that images obtained by the rear view camera have the unique characteristics of objects moving like ripples because the rear view camera is generally composed of a fish-eye lens for a wide view angle, the proposed method assumes that the Fourier transform magnitudes of the target frame and the previous frame are the same in the polar coordinate system. The second constraint is the object-domain constraint that utilizes intensities in an area of the target frame to which water drops have adhered. Specifically, the proposed method models a deterioration process of intensities that are corrupted by the water drop adhering to the rear view camera lens. By utilizing these novel constraints, the proposed ER algorithm can remove adherent water drops from images obtained by the rear view camera. Experimental results that verify the performance of the proposed method are represented.
  • Estimating Number of People Using Calibrated Monocular Camera Based on Geometrical Analysis of Surface Area
    Hiroyuki Arai, Isao Miyagawa, Hideki Koike, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 8, 1932, 1938, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2009年08月, [査読有り]
    英語, 研究論文(学術雑誌), We propose a novel technique for estimating the number of people in a video sequence; it has the advantages of being stable even in crowded situations and needing no ground-truth data. By analyzing the geometrical relationships between image pixels and their intersection volumes in the real world quantitatively, a foreground image directly indicates the number of people. Because foreground detection is possible even in crowded situations, the proposed method can be applied in such situations. Moreover, it can estimate the number of people in an a priori manner, so it needs no ground-truth data unlike existing feature-based estimation techniques. Experiments show the validity of the proposed method.
  • An Accurate Scene Segmentation Method Based on Graph Analysis Using Object Matching and Audio Feature
    Makoto Yamamoto, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 8, 1883, 1891, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2009年08月, [査読有り]
    英語, 研究論文(学術雑誌), A method for accurate scene segmentation using two kinds of directed graph obtained by object matching and audio features is proposed. Generally, in audiovisual materials, such as broadcast programs and movies, there are repeated appearances of similar shots that include frames of the same background, object or place, and such shots are included in a single scene. Many scene segmentation methods based on this idea have been proposed; however, since they use color information as visual features, they cannot provide accurate scene segmentation results if the color features change in different shots for which frames include the same object due to camera operations such as zooming and panning. In order to solve this problem, scene segmentation by the proposed method is realized by using two novel approaches. In the first approach, object matching is performed between two frames that are each included in different shots. By using these matching. results, repeated appearances of shots for which frames include the same object can be successfully found and represented as a directed graph. The proposed method also generates another directed graph that represents the repeated appearances of shots with similar audio features in the second approach. By combined use of these two directed graphs, degradation of scene segmentation accuracy, which results from using only one kind of graph, can be avoided in the proposed method and thereby accurate scene segmentation can be realized. Experimental results performed by applying the proposed method to actual broadcast programs are shown to verify the effectiveness of the proposed method.
  • 動的ファジィ制約充足における解の安定性維持
    須藤 康裕, 柳田 拓人, 栗原 正仁, 長谷山 美紀
    知能と情報 : 日本知能情報ファジィ学会誌 : journal of Japan Society for Fuzzy Theory and Intelligent Informatics, 21, 3, 372, 380, 日本知能情報ファジィ学会, 2009年06月15日
    日本語, ファジィ制約充足問題は人工知能の基礎戦術として知られる制約充足問題(CSP:Constraint Satisfaction Problem)を充足度を持たせることにより拡張した数理モデルである.一方,動的CSPの枠組みは現実世界における問題の部分的な変化と再求解を想定したモデルであり,その特徴は,問題を解きなおすコストの削減と解の安定性が求められることである.これら2つを組み合わせた数理モデルである動的ファジィCSP(DFCSP:Dynamic Fuzzy CSP)に関する研究は既存するが,CSPはNP完全問題として知られ,最悪計算量は指数オーダーとなることから,完全で高速な解法は存在しない. 本論文では,ファジィCSPのハイブリッド解法であるSRSアルゴリズムをDFCSPに適用し,さらに後処理としてのフィルタリングとしてSRSDアルゴリズムを導入することにより,大規模で複雑な問題に対しても,安定した実用的な許容解が得られることを,他の代表的な手法と比較することにより定量的に示す.
  • アクティブネットを用いたサッカー映像におけるパス可能領域の推定(画像認識,コンピュータビジョン)
    高橋 翔, 今 宏史, 長谷山 美紀
    電子情報通信学会論文誌. D, 情報・システム, 92, 4, 501, 510, 一般社団法人電子情報通信学会, 2009年04月01日
    日本語, 本論文では,チームスポーツ映像からアクティブネットを用いてパス可能領域を推定する手法を提案する.チームスポーツ映像の一つであるサッカー映像の意味内容解析を行うために重要なサッカーの戦術は,選手の移動とボール運びによって表現されるため,ボール運びを実現するパスを分析することは重要である.一般にパスコースはボール保持者と味方チームの選手へとつながる緩やかな曲線で表される.提案手法では,新たなエネルギーの定義とパス可能領域を推定するための画像生成により,アクティブネットを用いて前述の曲線が存在する領域を抽出する.また,パス可能領域は守備の選手から離れるほど,パスが成功する可能性が高いという特徴をもつ.提案手法では,格子点の密度に着眼することで,パスが成功する可能性をパス可能領域の推定と同時に得る.更に,アクティブネットの収束結果は多少の選手位置の誤差を許容するため,選手の動きを用いた従来手法における,選手位置の誤差の影響を受けやすいという問題点を解決することが可能である.したがって,提案手法はカメラワークが存在し,高精度な選手位置の推定が困難であるテレビ映像に対しても,高精度にパス可能領域の推定が可能である.
  • Kalman Filter-Based Error Concealment for Video Transmission
    Shigeki Takahashi, Takahiro Ogawa, Hirokazu Tanaka, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 3, 779, 787, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2009年03月, [査読有り]
    英語, 研究論文(学術雑誌), A novel error concealment method using a Kalman filter is presented ill this paper, In order to successfully utilize the Kalman filter, its state transition and observation models that are suitable for the video error concealment are newly defined as follows. The state transition model represents the video decoding process by a notion-compensated prediction. Furthermore, the new observation model that represents all image blurring process is defined. and calculation of the Kalman gain becomes possible. The problem of the traditional methods is solved by using the Kalman filter in the proposed method, and accurate reconstruction of corrupted video frames, is achieved. Consequently. an effective error concealment method using the Kalman filter is realized. Experimental results showed that the proposed method has better performance than that of traditional methods.
  • エッジの連続性を考慮したIFSによる画像の拡大(画像・映像処理)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    電子情報通信学会論文誌. D, 情報・システム, 92, 3, 382, 392, 一般社団法人電子情報通信学会, 2009年03月01日
    日本語, 本論文では,エッジの連続性を考慮した, Iterated Function System (IFS)に基づく画像拡大法を提案する.従来のIFS画像拡大法では,拡大後の画像において処理の最小単位となるブロックの境界で,本来存在しないはずの輝度値の変化が生じる.また,エッジの連続性を考慮しておらず,拡大後の画像におけるエッジが不連続となる問題が存在した.そこで提案手法では,まず,処理の最小単位となるブロックの重なりを許すことで, IFSによる高近似縮小写像を実現し,ブロック境界での輝度値の変化を抑制する.更に,連続性を保ったエッジの推定が可能であるラインプロセスを新たにIFS画像拡大法に導入する.このとき我々は,ラインプロセスを拡大後の画像のエッジを推定する手法に拡張することで,輝度値が未知である拡大後の画像に対しても,連続性を保ったエッジの推定を可能とする.また,提案手法では得られるエッジの存在を考慮した上でIFSに基づく画像拡大を行うことにより,従来法で発生していた拡大後の画像におけるエッジの不連続を解決し,高精細な拡大を実現する.本論文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する.
  • A Kalman Filter-Based Method for Restoration of Images Obtained by an In-Vehicle Camera in Foggy Conditions
    Tomoki Hiramatsu, Takahiro Ogawa, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 2, 577, 584, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2009年02月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a Kalman filter-based method for restoration of video images acquired by an in-vehicle camera in foggy conditions is proposed. In order to realize Kalman filter-based restoration, the proposed method clips local blocks from the target frame by using a sliding window and regards the intensities in each block as elements of the state variable of the Kalman filter. Furthermore, the proposed method designs the following two models for restoration of foggy images. The first one is an observation model, which represents a fog deterioration model. The proposed method automatically determines all parameters of the fog deterioration model from only the foggy images to design the observation model. The second one is a non-linear state transition model, which represents the target frame in the original video image from its previous frame based on motion vectors. By utilizing the observation and state transition models, the correlation between successive frames can be effectively utilized for restoration, and accurate restoration of images obtained in foggy conditions can be achieved. Experimental results show that the proposed method has better performance than that of the traditional method based on the fog deterioration model.
  • 情報大航海プロジェクトにおける共通技術 : 画像・映像処理技術の紹介
    長谷山 美紀, 久光 徹
    映像情報メディア学会誌 : 映像情報メディア, 63, 1, 42, 47, 一般社団法人映像情報メディア学会, 2009年
    日本語, 2007年度に3年計画でスタートした情報大航海プロジェクトは,モデルサービスによる実証を通じて次世代の情報検索・解析技術を開発することを目的としている.同時に,実証を通じた制度的課題の洗い出しにより,市場創出に必要な環境整備を目指している.本稿では,開発された技術の中から,マルチメディア情報処理の中核を担う,画像・映像処理技術を紹介する.
  • 選択情報が不要な適応内挿フィルタを用いた動画像符号化の高性能化
    近藤 敏志, 松野 孝也, 長谷山 美紀
    映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 63, 11, 1592, 1597, 映像情報メディア学会, 2009年
    日本語, 研究論文(学術雑誌), We propose a method to improve performance of video coding using an adaptive interpolation filter technique. The adaptive interpolation technique was based on clustering using the k-means method and did not need filter selection information. To improve the performance of the clustering, we introduced autocorrelation coefficients of the pixel values and the directions of the motion vectors as the new features and the Mahalanobis distance as the distance scale in the k-means method. We also used vector quantization to reduce the number of interpolation filter coefficients. In the simulation, our proposed method was implemented in the MPEG-2 based video codec. The simulation results show that the proposed method can reduce the bit rate by up to nearly 7 % compared to conventional adaptive interpolation filter methods.
  • Accurate Graph-Based Scene Segmentation Using Object Matching and Audio Feature
    Makoto Yamamoto, Miki Haseyama
    ISCE: 2009 IEEE 13TH INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS, VOLS 1 AND 2, 670, 671, IEEE, 2009年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A method for accurate scene segmentation utilizing two kinds of directed graph obtained by object matching and by using audio features is proposed. Generally, in audiovisual materials, there are repeated appearances of shots that include frames of the same background, object or place. It should be assumed that such shots are included in a single scene. In the proposed method, by performing object matching between two frames that are each included in different shots, multiple shots for which frames include the same object can be successfully found and their repeated appearances are represented as a directed graph. The proposed method also generates another directed graph that represents the repeated appearances of shots with similar audio features. By the combined use of these two graphs, accurate scene segmentation can be realized. The effectiveness of the proposed method is verified by applying this method to news programs and another broadcast program.
  • Semantic Image Retrieval Based on POCS Algorithm Using Kernel PCA And Its Performance Verification
    Takahiro Ogawa, Miki Haseyama
    ISCE: 2009 IEEE 13TH INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS, VOLS 1 AND 2, 342, 343, IEEE, 2009年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a projection onto convex sets (POCS)-based semantic image retrieval method and its performance verification. The main contributions of the proposed method are twofold: introduction of nonlinear eigenspace of visual and semantic features into the constraint of the POCS-based semantic image retrieval algorithm and adaptive selection of the annotated images utilized for this algorithm. Then, by combining these two approaches., the semantic features of the query image are successfully estimated, and accurate image retrieval can be expected. Finally, relationship between the performance of the proposed method and the kinds of the kernel functions utilized for the kernel PICA is shown in this paper.
  • A new image retrieval interface and its practical use in "View Search Hokkaido"
    Miki Haseyama, Toshifumi Murata, Hisashi Ukawa
    ISCE: 2009 IEEE 13TH INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS, VOLS 1 AND 2, 624, +, IEEE, 2009年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), New image retrieval technology, which is used for a service demonstration project "View Search Hokkaido" in "Information Grand Voyage Project" conducted by Ministry of Economy, Trade and Industry, Japan, is presented in this paper. The new technology enables image retrieval based on low-level features without utilizing any tag-based scheme and realizes a 3D interface for image retrieval. This 3D interface can provide new user experience, which has not been provided by the conventional retrieval services. The effectiveness of the 3D interface has been verified in "View Search Hokkaido".
  • 映像処理技術の変革と映像メディア
    長谷山 美紀
    映像情報メディア学会誌 : 映像情報メディア, 62, 4, K12, K12, 一般社団法人映像情報メディア学会, 2008年04月01日
    日本語
  • 3-2. メディア流通・処理(3.メディア情報,<特集>映像情報メディア年報)
    上倉 一人, 長谷山 美紀, 村上 和人
    映像情報メディア学会誌 : 映像情報メディア, 62, 8, 1251, 1254, 一般社団法人映像情報メディア学会, 2008年
    日本語, 研究論文(学術雑誌)
  • Estimating the number of people in a video sequence via geometrical model.
    Hiroyuki Arai, Isao Miyagawa, Hideki Koike, Miki Haseyama
    19th International Conference on Pattern Recognition (ICPR 2008)(ICPR), 1, 4, IEEE Computer Society, 2008年
    研究論文(国際会議プロシーディングス)
  • KERNEL PCA-BASED SEMANTIC FEATURE ESTIMATION APPROACH FOR SIMILAR IMAGE RETRIEVAL
    Takahiro Ogawa, Miki Haseyama
    2008 IEEE International Conference on Image Processing, Proceedings, 969, 972, IEEE, 2008年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A kernel PCA-based semantic feature estimation approach for similar image retrieval is presented in this paper. Utilizing database images previously annotated by keywords, tire proposed method estimates unknown semantic features of a query image. First, our method performs semantic clustering of the database images and derives a new map from a nonlinear eigenspace of visual and semantic features in each c aster. This map accurately provides the semantic features for the images belonging to each cluster by using their visual features. Further, in order to select the optional cluster including the query image, the proposed method monitors errors of the visual features caused by the Semantic feature estimation process. Then, even if any semantics of the query image arc unknown, its semantic features are successfully estimated by tire optimal cluster. Experimental results verify the effectiveness of the proposed method for semantic image retrieval.
  • カルマンフィルタと適応信号処理, 谷萩隆嗣著, (コロナ社, Tel.03-3941-3131, 2005年, A5判, 282頁, 定価4,515円(税込))
    長谷山 美紀
    日本音響学会誌, 63, 8, 社団法人日本音響学会, 2007年08月01日
    日本語
  • Audio-based shot classification for audiovisual indexing using PCA, MGD and fuzzy algorithm
    Naoki Nitanda, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E90A, 8, 1542, 1548, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2007年08月, [査読有り]
    英語, 研究論文(学術雑誌), An audio-based shot classification method for audiovisual indexing is proposed in this paper. The proposed method mainly consists of two parts, an audio analysis part and a shot classification part. In the audio analysis part, the proposed method utilizes both principal component analysis (PCA) and Mahalanobis generalized distance (MGD). The effective features for the analysis can be automatically obtained by using PCA, and these features are analyzed based on MGD, which can take into account the correlations of the data set. Thus, accurate analysis results can be obtained by the combined use of PCA and MGD. In the shot classification part, the proposed method utilizes a fuzzy algorithm. By using the fuzzy algorithm, the mixing rate of the multiple audio sources can be roughly measured, and thereby accurate shot classification can be attained. Results of experiments performed by applying the proposed method to actual audiovisual materials are shown to verify the effectiveness of the proposed method.
  • Players clustering based on graph theory tor tactics analysis purpose in soccer videos
    Hiroftuni Kon, Miki Haseyama
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E90A, 8, 1528, 1533, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2007年08月, [査読有り]
    英語, 研究論文(学術雑誌), In this paper, a new method for clustering of players in order to analyze games in soccer videos is proposed. The proposed method classifies players who are closely related in terms of soccer tactics into one group. Considering soccer tactics, the players in one group are located near each other. For this reason, the Euclidean distance between the players is an effective measurement for the clustering of players. However, the distance is not sufficient to extract tactics-based groups. Therefore, we utilize a modified version of the community extraction method, which finds community structure by dividing a non-directed graph. The use of this method in addition to the distance enables accurate clustering of players.
  • 小規模データベースにおける学術論文の関連性可視化手法
    二反田 直己, 鎌倉 純一, 長谷山 美紀
    信号処理, 11, 2, 179, 185, 〔信号処理学会〕, 2007年03月
    日本語
  • Phase retrieval based on a snake for image reconstruction
    Keiko Kondo, Miki Haseyama, Hideo Kitajima
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E90D, 1, 283, 287, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2007年01月
    英語, 研究論文(学術雑誌), A new phase retrieval method using an active contour model (snake) for image reconstruction is proposed. The proposed method reconstructs a target image by retrieving the phase from the magnitude of its Fourier transform and the measured area of the image. In general, the measured area is different from the true area where the target image exists. Thus a snake, which can extract the shape of the target image, is utilized to renew the measured area. By processing this renewal iteratively, the area obtained by the snake converges to the true area and as a result the proposed method can accurately reconstruct a target image even when the measured area is different from the true area. Experimental results show the effectiveness of the proposed method.
  • Steady-state properties of a CORDIC-based adaptive ARMA lattice filter
    Shin'ichi Shiraishi, Miki Haseyama, Hideo Kitajima
    IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E89A, 12, 3724, 3729, IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 2006年12月
    英語, 研究論文(学術雑誌), This paper analyzes the steady-state properties of a CORDIC-based adaptive ARMA lattice filter. In our previous study, the convergence properties of the filter in the non-steady state were clarified; however, its behavior in the steady state was not discussed. Therefore, we develop a distinct analysis technique based on a Markov chain in order to investigate the steady-state properties of the filter. By using the proposed technique, the relationship between step size and coefficient estimation error is revealed.
  • 基礎シリーズ 線形予測理論とラティスフィルタアルゴリズム(2)ARラティスフィルタの実現とその性質
    長谷山 美紀
    信号処理, 10, 5, 309, 315, 〔信号処理学会〕, 2006年09月
    日本語
  • 輝度こう配ベクトルを用いた画像識別方法(画像認識,コンピュータビジョン)
    平本 政夫, 小川 貴弘, 長谷山 美紀
    電子情報通信学会論文誌. D, 情報・システム, 89, 6, 1348, 1358, 一般社団法人電子情報通信学会, 2006年06月01日
    日本語, 本論文では,撮像素子の多面素化や高画質化の流れを踏まえ,画像の回転・移動等の幾何学的変換にも対応できる大局的な画像識別方法を提案している.提案手法は,ベクトルを利用した投票方式を用いかものであり,画像を輝度こう配を表すベクトルと位置を示すベクトルで表現し,識別のための投票ベクトルと類似度を定義している.また提案手法では,同一画像であれば得票場所が原点に集中し,得票結果が幾何学的な変換に影響されないという特徴がある.原画像に対してガウシアン,メジアンのフィルタリング処理,JPEG圧縮処理を施した画像も含め,自然画像の識別実験を行ったところ,類似性において明確な差が現れ,画像に対して人工的な処理を加えても識別可能であることが分かった.更に提案手法の応用として,最多得票点を利用した画像の識別について検討したところ,識別能力が高く,1画像内に含まれる部分画像の識別も可能であることを示すことができた.
  • 基礎シリーズ 線形予測理論とラティスフィルタアルゴリズム(1)線形予測とARモデル同定
    長谷山 美紀
    信号処理, 10, 3, 153, 159, 〔信号処理学会〕, 2006年05月
    日本語
  • 知的情報アクセスを実現するための映像検索に関する研究動向 (映像・音響信号処理の将来展望と課題)
    長谷山 美紀
    回路とシステム軽井沢ワークショップ論文集, 19, 199, 203, [電子情報通信学会], 2006年04月24日
    日本語
  • 色エッジ及び並列実行の領域統合を用いたWatershed画像領域分割法の改善(画像認識,コンピュータビジョン)
    趙 延軍, 長谷山 美紀, 北島 秀夫
    電子情報通信学会論文誌. D, 情報・システム, 89, 4, 836, 849, 一般社団法人電子情報通信学会, 2006年04月01日
    日本語, 画像内容に基づく画像処理では,画素ではなく,画像中の物体を構成する領域を対象とし,画像の圧縮,検索,認識等様々な処理を行う.そのため,領域を検出し,ラベルを付与する画像分割が必要になる.本論文では画像における輝度値の空間分布を地形とみなすWatershedアルゴリズムによる領域分割を検討する.Watershedアルゴリズムにより,閉じた単一の領域分割線が得られるが,分割結果には領域の未分割及び過剰分割という問題が発生する.本論文においてはこれらの問題を解決するために,原画像を直接処理することではなく,連続エッジと均質部分の両方が強調できる色エッジの強度画像を分割対象とする.更に,未分割と過剰分割とを防ぐために,色エッジの強度画像に対する分割結果を初期領域として,ノイズ抑制を考慮した並列実行の領域統合を行う.提案手法を各種の画像へ適用した結果によりその有効性を示す.
  • A multi-objective service restoration method for power distribution systems
    Jun Inagaki, Jun Nakajima, Miki Haseyama
    2006 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOLS 1-11, PROCEEDINGS, 1784, +, IEEE, 2006年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), Service restoration problem in distribution systems is formulated as a multi-objective optimization problem which is demanded not only for minimizing the amount of unrestored total loads but also for minimizing the number of the switching operations. The solution of the multi-objective optimization problem is usually obtained with a set of Pareto optimal solutions. The Pareto optimal solutions for the service restoration problem are useful for users to obtain their desired restoration by comparing a Pareto optimal solution with the others. However, the conventional methods cannot obtain several Pareto optimal solutions in one trial. Therefore, this paper proposes a method for obtaining the Pareto optimal set for the service restoration problem with a genetic algorithm. The genetic algorithm produces many possible solutions in its search process. By utilizing this feature, the proposed method can obtain the Pareto optimal set.
  • Restoration method of missing areas in still images using GMRF model
    T Ogawa, M Haseyama, H Kitajima
    2005 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (ISCAS), VOLS 1-6, CONFERENCE PROCEEDINGS, 4931, 4934, IEEE, 2005年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a GMRF-model based restoration method of missing areas in still images. The GMRF model used in the proposed method is realized by a new assumption that reasonably holds for an image source. This model can express important image features such as edges because of the use of the new assumption. Therefore, the proposed method restores the missing areas using the modified GMRF model and can correctly reconstruct the missing edges. Consequently, the proposed method achieves more accurate restoration than those of the traditional methods on both objective and subjective measures. Extensive experimental results demonstrate the improvement of the proposed method over the previous methods.
  • GA-based applications for routing with an upper bound constraint
    J Inagaki, M Haseyama
    2005 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (ISCAS), VOLS 1-6, CONFERENCE PROCEEDINGS, 2239, 2242, IEEE, 2005年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper presents a method of searching for the shortest route via the most designated points among the routes whose lengths are less than the upper bound using a genetic algorithm (GA). If chromosomes whose route lengths exceed the upper bound are simply screened out in the GA process, the optimization probability gets worse. For the purpose of solving this problem, this paper proposes a new fitness function including an upper bound constraint which can be flexibly changed during the searching process. By using this function, the optimum is efficiently obtained and the optimization probability can be raised. Furthermore, the effectiveness of the proposed method is verified by the experiments applying it to the actual map data.
  • Audio signal segmentation and classification for scene-cut detection
    N Nitanda, M Haseyama, H Kitajima
    2005 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (ISCAS), VOLS 1-6, CONFERENCE PROCEEDINGS, 4030, 4033, IEEE, 2005年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), A scene is regarded as a basic unit of audiovisual material, and thereby the boundaries between two adjacent scenes, which are called scene-cuts, must be detected in advance for audiovisual indexing. This paper proposes a scene-cut detection method. Since scene-cuts are associated with a simultaneous change of visual and audio characteristics, both audio and visual analyses are required for the scene-cut detection. For the audio signal analysis, the proposed method utilizes an audio signal segmentation and classification method using fuzzy c-means clustering, which has been proposed by the authors. For the visual signal analysis, the proposed method utilizes some visual segmentation methods. By using these methods simultaneously, the proposed method can accurately detect the scene-cuts, and thereby it is highly valuable for the preprocessing of the audiovisual indexing. Experimental results performed by applying the proposed method to real audiovisual material are shown to verify its high performance.
  • Quality improvement technique for JPEG images with fractal image coding
    M Takezawa, H Sanada, K Watanabe, M Haseyama
    2005 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (ISCAS), VOLS 1-6, CONFERENCE PROCEEDINGS, 6320, 6323, IEEE, 2005年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a quality improvement technique for JPEG images by using fractal image coding. JPEG coding is a commonly used standard method of compressing images. However, in its decoded images, quantization noise is sometimes visible in high frequency regions, such as the edges of objects. Hence, in order for the JPEG coding to become a more powerful image-coding method, the JPEG image quality must be improved. Therefore, our method solves this problem by adding the obtained codes by the fractal image coding to improve the image quality. Some simulation results verify that the proposed method achieved higher coding-performance than the traditional JPEG coding.
  • A GA-based fast search algorithm for realizing efficiency motion compensation
    S Asamizu, M Haseyama
    8TH WORLD MULTI-CONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL VI, PROCEEDINGS, 185, 190, INT INST INFORMATICS & SYSTEMICS, 2004年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a fast search technique using a genetic algorithm (GA) [1] for realizing efficiency motion compensation. Previously proposed method[2] that the motion compensation based on table lookup refers to two or more frames with one motion table. Therefore, dispersion of the prediction error of each frame is not only dispersion of the image quality of each prediction image but also influences the search speed of the motion table designing. In this proposed method, the prediction error of each frame is obtained by using the block matching method[3] before the motion table is designed. The weight of each frame is put from the obtained prediction error to the fitness function of the GA, and the GA searches for the optimal motion table. Based on this strategy, the proposed method can search for a motion table more effectively.
  • New JPEG coding algorithm including fractal image coding for color images
    M Takezawa, M Haseyama
    8TH WORLD MULTI-CONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL VI, PROCEEDINGS, 333, 336, INT INST INFORMATICS & SYSTEMICS, 2004年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes an effective JPEG coding algorithm using fractal image coding for color images. In the JPEG images, quantization noise is sometimes visible in high frequency regions, such as the edges of objects. Hence, in order for the JPEG coding to become a more powerful image-coding method, the JPEG image quality must be improved. Therefore, in this paper, a quality improvement method for the color JPEG images is proposed by using the fractal image coding. Some simulation results verify that the proposed method can improve the image quality. in the high frequency regions and provide the decoded image with 0.4 dB higher quality than the traditional JPEG.
  • A trainable retrieval system for cartoon character images
    M Haseyama, A Matsumura
    2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL III, PROCEEDINGS, 673, 676, IEEE, 2003年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a novel method to retrieve cartoon character images in a database or network. In this method, partial features of an image, defined as Regions and Aspects, are used as keys to identify cartoon character images. The similarities between a query cartoon character image and the images in the database are computed by using these features. Based on the similarities the cartoon images same or similar to the query image are identified and retrieved from the database. Moreover, our method adopts a training scheme to reflect the user's subjectivity. The training emphasizes the signficant Regions or Aspects by assigning more weight based on the user's preferences and actions, such as selecting a desired image or an area of an image. These processes make the retrieval more effective and accurate. Experiment results verify the effectiveness and retrieval accuracy of the method.
  • 2-D functional AR model for image identification
    M Haseyama, Kondo, I
    2003 INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO, VOL II, PROCEEDINGS, 377, 380, IEEE, 2003年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a 2-D Functional AR Model for image identification. The definition of the proposed model includes functions that can exploit the self-similarity nature in images to throughly extract image features. By introducing the functional scheme into the model, only a few number of parameters, which are called 2-D Functional AR parameters, can describe the image features simply and accurately. These characteristics make the model suitable for image identification applications. Some experiments of image identification are performed, and the results verify that the proposed model accurately represents the image feature, and the image can be correctly, identified. The calculation time is fast enough for practical use in image retrieval.
  • E cient fixed-valued and random-valued impulse detection for accurate image restoration
    K Kondo, M Haseyama, H Kitajima
    ISPA 2003: PROCEEDINGS OF THE 3RD INTERNATIONAL SYMPOSIUM ON IMAGE AND SIGNAL PROCESSING AND ANALYSIS, PTS 1 AND 2, 1009, 1012, UNIV ZAGREB, FACULTY MECHANICAL ENGINEERING & NAVAL ARCHITECTURE, 2003年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), This paper proposes a novel impulse detection method for the restoration of images corrupted by impulse noise. Conventional impulse detection methods tend to work well for fixed-valued impulse noise but poorly for random-valued impulse noise. The proposed method can accurately detect not only fixed-valued but also random-valued impulse noise by using two different systems. The first system detects impulse noise by considering the di erences between the intensity of a target pixel and the output of a median filter The second system verifies whether the impulse detection results obtained by the first system are correct. By using these systems, the proposed method can accurately detect both types of impulse noise even in highly corrupted images. Furthermore, the proposed method can be e ectively used as a preprocessor for noise reduction filtering. Experiments are presented to demonstrate the e ectiveness of the proposed method.
  • Two-dimensional analysis of magnetic microstructures in the DC-demagnetized state and magnetization fluctuations in the transition region using MFM images
    Takekuma, I, M Haseyama, K Sueoka, K Mukasa
    JOURNAL OF MAGNETISM AND MAGNETIC MATERIALS, 239, 1-3, 359, 362, ELSEVIER SCIENCE BV, 2002年02月, [査読有り]
    英語, 研究論文(学術雑誌), This study analyzed the directional dependence of magnetic microstructures of media by focusing on the distribution of magnetic poles. Media, whose magnetic poles tend to be distributed along a specific direction in the DC-demagnetized state, have larger magnetization fluctuations in the transition region, larger medium noise and higher partial erasure (PE) probability than media with uniform magnetic pole distribution. (C) 2002 Elsevier Science B.V. All rights reserved.
  • A new approach with IFS for image restoration.
    Miki Haseyama, Megumi Takezawa, Junichi Miura, Hideo Kitajima
    10th European Signal Processing Conference(EUSIPCO), 1, 4, IEEE, 2000年
    研究論文(国際会議プロシーディングス)
  • A practical method to reduce a number of reference signals for the ANC system
    M Akiho, M Haseyama, H Kitajima
    ICASSP '99: 1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, PROCEEDINGS VOLS I-VI, 2387, 2390, IEEE, 1999年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), In this paper, we propose a practical method to reduce a number of reference signals for the active noise cancellation (ANC) system and the filter characteristics to generate the reduced number of reference signals, which maintain the original value of the coherence function. This method finds the number of independent noise sources and provides the filter characteristics based on SVD (singular value decomposition) of the power spectrum matrix of the reference signals. Then, we also use the multiple coherence function analysis to select dominant components in the reference signals. The method contributes greatly in reducing the number of reference signals for the ANC system that uses the large number of reference signals. We also discuss the characteristics of the filters that synthesis the new set of reference signals. And an experimental test is performed to confirm the theory.
  • A genetic algorithm based image segmentation for image analysis
    M Haseyama, M Kumagai, H Kitajima
    ICASSP '99: 1999 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, PROCEEDINGS VOLS I-VI, 3445, 3448, IEEE, 1999年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス), In this paper a new genetic algorithm (GA) based image segmentation method is proposed for image analysis. This method using a mean square error (MSE) based criterion can segment an image into some regions, while estimating a suitable region representation. The criterion is defined as MSE caused by interpolating each region of an observed image with a parametric model. Since the criterion is expressed with not only the parameters of the model but also shape and location of the regions, the criterion can not be easily minimized by the usual optimization methods, the proposed method minimizes the criterion by a GA. The proposed method also includes a processor to eliminate fragile regions with the Markov random field (MRF) model. Though the thresholds of the existent methods negatively affect image segmentation results; since no thresholds are required in the proposed method, it segments images more accurately than the existent methods.
  • A realization method of an ARMAX lattice filter
    M HASEYAMA, T HIROHKU, H KITAJIMA
    1995 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOLS 1-3, 365, 368, I E E E, 1995年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)
  • FREQUENCY-WEIGHTING MODEL IDENTIFICATION WITH AN ADAPTIVE ARMA LATTICE FILTER
    M HASEYAMA, N NAGAI, N MIKI
    IEEE INTERNATIONAL CONFERENCE ON SYSTEMS ENGINEERING, 543, 546, I E E E, 1992年, [査読有り]
    英語, 研究論文(国際会議プロシーディングス)

その他活動・業績

  • モーションおよび視線データを用いたSpatial Temporal Attention GCNによる熟練度分類に関する検討
    清野竜生, 斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀, 人工知能学会全国大会論文集(Web), 38th, 2024年
  • Spatial-temporal attentionを導入した再帰型ニューラルネットワークに基づく重機との接触事故リスクの推定
    五箇亮太, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 5, 1, 2024年
  • 工事現場の定点カメラを用いた物体検出および姿勢推定に基づくZero-shot高リスク状況検出
    大羽賀駿也, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 5, 1, 2024年
  • 大規模言語モデルを用いた 通報音声からの事象発生地点予測
    吉田将規, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 5, 1, 2024年
  • ユーザの視線情報を考慮したコンテンツベースの画像再検索に関する検討—A note on gaze-dependent image re-ranking for content-based image retrieval—マルチメディアストレージ メディア工学 映像表現&コンピュータグラフィックス
    馮 鈺虎, 前田 圭介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 47, 6, 89, 93, 2023年02月
    東京 : 映像情報メディア学会, 日本語
  • Spatial Temporal Attention Graph Convolutional Networkによるモーションデータを用いた熟練度の分類に関する検討
    清野竜生, 斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2023, 2023年
  • 変状の劣化レベル判定支援に向けたグラフニューラルネットワークによるレコードデータの特徴表現の獲得
    山本一輝, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 4, 3, 2023年
  • 地下鉄トンネル点検技術者の新規変状の発見率向上に向けた一人称視点映像からの変状検出
    櫻井慶悟, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 4, 3, 2023年
  • 時系列データを用いたMulti-modal Transformerに基づく冬期路面状態の分類
    諸戸祐哉, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 4, 3, 2023年
  • 北海道大学におけるデータ駆動型融合研究創発の取組
    長谷山美紀, 水谷祐輔, 田中晋吾, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • データ横断型対照学習を用いた道路構造物における変状画像の劣化レベル分類
    東孝明, 小川直輝, 前田圭介, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 4, 2, 2023年
  • 属性情報の階層関係を考慮したアニメイラストのマルチラベル分類に関する検討
    LAM Ziwen, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • データベース特化型クロスモーダル画像検索のためのテキストプロンプトチューニングに関する検討
    ZHANG Huaying, 柳凛太郎, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • 360度映像におけるマルチビュー学習に基づくバイノーラル音声生成の高精度化に関する検討
    吉田将規, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • クラス情報を導入したグラフ表現による教師有り潜在変数モデルの高精度化に関する検討
    渡部航史, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • ユーザの視線情報を考慮したコンテンツベースの画像再検索に関する検討
    FENG Yuhu, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • サッカー映像における時空間的関係を考慮したシュート予測の高精度化に関する検討-競技者のチーム情報に基づく完全二部グラフの導入-
    五箇亮太, 諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • 物体検出モデルに基づく視覚表現を用いた解釈可能なVisual Question Answeringモデルに関する検討
    ZHU He, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 47, 6(MMS2023 1-34/ME2023 21-54/AIT2023 1-34), 2023年
  • A Note on Automatic Diagnosis of Helicobacter Pylori Infection Based on Self-Supervised Learning and Self-Knowledge Distillation: マルチメディアストレージ メディア工学 映像表現&コンピュータグラフィックス
    トウゴ レン, マベ カツヒロ, ニシダ シュンペイ, トモダ ヨシヒロ, オガワ タカヒロ, ハセヤマ ミキ, 46, 6, 49, 52, 2022年02月
    英語
  • AIの実社会応用とインフラ分野の将来像
    長谷山美紀, 高速道路と自動車, 65, 12, 2022年
  • 異種特徴間の相関およびAttention Mapの確信度を考慮可能な変状画像の劣化レベル分類
    小川直輝, 前田圭介, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 3, J2, 2022年
  • テキストおよび画像情報に基づくFocal Lossを導入した深層学習による冬期路面状態の分類
    諸戸祐哉, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 3, J2, 2022年
  • 地下鉄トンネル点検時の一人称視点映像を用いたVision Transformerに基づく変状検出
    櫻井慶悟, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 3, J2, 2022年
  • インフラ施設の変状の評価を支援する効率的な映像提示に向けた技術者の点検動作分類
    上川恭平, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, AI・データサイエンス論文集(Web), 3, J2, 2022年
  • セマンティックセグメンテーションに対するマルチソースモデル適応に関する検討-複数のソースモデルからの不変な特徴表現の学習による適応精度の向上-
    LI Zongyao, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • ユーザの嗜好を考慮した強化学習と知識グラフに基づく楽曲プレイリスト生成に関する検討
    櫻井慶悟, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • Variational Autoencoderに基づく深層生成モデルを用いた潜在表現のDisentanglementに関する検討-Disentanglement評価指標を含む正則化損失の導入-
    中川真, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 協調フィルタリングにおける潜在因子モデルの埋め込み表現と人気バイアスの関係の検討
    岡村洋希, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • ドメイン共有ネットワークに基づく嗜好のドメイン依存性に頑健な推薦システムに関する検討
    山本一輝, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • pixelNeRFによる生成画像を用いた視点の変化に頑健な画像検索手法に関する検討
    江良勇輝, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • フーリエ振幅成分を考慮したNeural Radiance Fieldsのノンリファレンス評価指標に関する検討
    河合雅斗, 柳凛太郎, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • サッカー競技のスカウティング映像における選手間の時空間的関係を考慮した不確実性に基づくシュートイベント予測に関する検討
    五箇亮太, 諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • 画像注視時の脳活動データを用いたVQAモデルに基づく認知内容推定に関する検討-fMRIデコーダに用いる回帰モデルによる推定精度に関する検証-
    七田亮, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • 眼底画像を用いた教師なしドメイン適応に基づく糖尿病性網膜症の重症度の推定に関する検討
    國枝翼, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2022, 2022年
  • ゴム材料開発のためのGenerative Adversarial Networkに基づく配合量および物性からの電子顕微鏡画像の生成に関する一検討
    柳凜太郎, 藤後廉, 前田圭介, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 道路構造物の維持管理効率化に向けた変状画像分類の高精度化に関する検討-テキストデータに基づく類似事例の含有率の導入-
    平川泰成, 小川直輝, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 地下鉄トンネルの維持管理支援のためのマルチスケール解析を導入した深層学習に基づく変状検出に関する検討
    高田紗弥, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 画像注視時の脳活動信号を用いた圧縮再構成ネットワークに基づく視覚認知内容の推定に関する検討
    東孝明, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • ユーザの動作情報を用いたコンテンツの関心度推定に関する検討-複数ユーザを導入した特徴統合の有効性検証-
    上川恭平, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 知識蒸留を用いたFew-shot Learningに基づく画像の感情ラベル推定に関する検討
    YE Yingrui, 諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 地下鉄トンネル点検時の技術者から取得される生体信号と技術者の点検行動の関連性分析
    平澤魁人, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • 画像中の物体情報を考慮したユーザ類似度に基づく個人に特化した注視領域の推定に関する検討
    諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • Attention mapに対する確信度を考慮可能な深層学習を用いた変状分類の高精度化に関する検討
    小川直輝, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 46, 6(MMS2022 1-37/ME2022 26-62/AIT2022 1-37), 2022年
  • AIの実社会応用と次世代インフラ維持管理
    長谷山 美紀, 学士会会報, 2022, 1, 78, 83, 2022年01月
    学士会, 日本語
  • A Note on Automatic Diagnosis of Helicobacter Pylori Infection Based on EfficientNet with Flooding Loss: マルチメディアストレージ メディア工学 映像表現&コンピュータグラフィックス
    トウゴ レン, マベ カツヒロ, ニシダ シュンペイ, トモダ ヨシヒロ, シミズ ヒカリ, オガワ タカヒロ, ハセヤマ ミキ, 45, 4, 23, 26, 2021年02月
    英語
  • Detecting axillary lymph node metastasis of breast cancer with FDG-PET/CT images based on attention mechanism: FDG-PET/CT画像を用いたattention mechanismに基づく乳癌の腋窩リンパ節転移の検出: マルチメディアストレージ メディア工学 映像表現&コンピュータグラフィックス
    トウゴ レン, ヒラタ ケンジ, キタジマ カズヒロ, タケナカ ジュンキ, ミヨシ ヤスオ, クドウ コウスケ, オガワ タカヒロ, ハセヤマ ミキ, 45, 4, 33, 36, 2021年02月
    英語
  • Audio-visual立体化モデルを用いた画面外音声検出に関する検討-自己教師あり学習手法に基づくAudio-visual特徴表現の導入-
    吉田将規, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • 画像特徴の表現能力が世界モデルのパフォーマンスに与える影響の検証
    大羽賀駿也, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • Shilling attackの状況下におけるグラフ解析に基づく推薦システムの脆弱性の検証
    小野寺望, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • グラフ畳み込みネットワークに基づくアニメイラストのマルチラベル画像認識に関する検討
    LAN Ziwen, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • 自己教師あり学習を導入した潜在変数モデルによる低次元特徴の抽出に関する検討
    渡部航史, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • Few-shot Learningを用いた感情ラベル推定における複数のデータセット利用に関する初期検討
    YE Yingrui, 諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • テキスト入力型画像操作における操作領域に着目した精度評価に関する検討
    渡邉優宇人, 藤後廉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2021, 2021年
  • 画像注視時の脳活動データを用いた質問応答生成モデルに基づく意味内容の推定に関する検討-fine-tuningに基づく高精度化-
    高田紗弥, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 27, 31, 2021年
    映像情報メディア学会, 日本語
  • Image Captioningの導入による画像の感情推定の高精度化に関する検討
    LIANG Yun, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 65, 69, 2021年
    映像情報メディア学会, 日本語
  • 画像特徴を用いた多層グラフ解析に基づくクロスドメイン推薦に関する検討
    平川泰成, 前田圭介, 小川貴弘, 浅水仁, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 59, 63, 2021年
    映像情報メディア学会, 日本語
  • 地下鉄トンネルの維持管理支援を目的とした深層学習に基づく変状検出の高精度化に関する検討-壁面の施工方法に注目した精度検証-
    春山知生, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • 実店舗の防犯カメラ映像データを用いた顧客の関心推定に関する検討-姿勢推定モデルから得られる特徴量を用いた異常検知モデルの精度検証-
    本間勇紀, 本間勇紀, 藤後廉, 阿部真育, 小川貴弘, 長谷山美紀, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • 電子顕微鏡により撮像されたゴム材料からの異常検知に基づく劣化領域の推定に関する一検討~深層学習モデルにより抽出された特徴表現の有効性検証~
    松本真直, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • 地下鉄トンネル点検時の技術者から取得される視線およびモーションデータに基づく熟練度の推定に関する検討
    赤松祐亮, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • TCCに基づく自己教師学習による特徴表現を用いた映像中の人物動作の検出に関する検討-動作検出パラメータが与える影響に対する考察-
    増田毅, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • 路面画像を用いた深層学習に基づく路面状態の分類に関する検討
    諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • サッカー映像における情報の提示位置の推定に関する検討-視聴者の注視位置および選手位置に基づいたオブジェクト配置の決定-
    鈴木元樹, 高橋翔, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • Twitterと映像を用いたMVAEに基づく野球映像の重要シーン予測に関する検討
    平澤魁人, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • ユーザの嗜好を反映可能なインテリアコーディネート検索技術の構築-コーディネートを表現可能な特徴の抽出と実データへの適用-
    藤後廉, 小川貴弘, 長谷山美紀, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • Attention Mapを用いた道路構造物の変状画像分類におけるテキストデータの導入に基づく高精度化に関する検討
    小川直輝, 前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 17, 21, 2021年
    映像情報メディア学会, 日本語
  • ゴム材料開発のためのConditional StyleGANに基づく配合量からの電子顕微鏡画像の生成に関する一検討
    柳凜太郎, 藤後廉, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 4(MMS2021 1-28/ME2021 1-28/AIT2021 1-28), 2021年
  • AIを中心とした医療デジタル技術基盤の構築へ向けた取り組み
    藤後廉, 小川貴弘, 長谷山美紀, 日本消化器がん検診学会雑誌(Web), 59, Supplement 1, 2021年
  • マルチメディアAI技術に基づく異分野融合研究と実社会応用
    小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 45, 13(IST2021 22-29/ME2021 53-60), 2021年
  • 消化管がんの検診・スクリーニングにおけるトピックス 5 ピロリ菌感染胃炎の胃X線スクリーニングにおけるAIの活用
    竹内千尋, 藤後廉, 小川貴弘, 長谷山美紀, 山道信毅, 臨床消化器内科, 36, 8, 1062, 1065, 2021年
    日本メディカルセンター
  • データサイエンスのあるべき姿とは : 高等教育・研究機関における取り組みを通じての意見交換会—特集 データサイエンス教育の潮流(その1)
    木島 正明, 竹村 彰通, 長谷山 美紀, 椿 広計, 蓮池 隆, オペレーションズ・リサーチ = Communications of the Operations Research Society of Japan : 経営の科学, 65, 10, 525, 536, 2020年10月
    日本オペレーションズ・リサーチ学会 ; 1956-, 日本語
  • メディア工学研究委員会—Technical Group on Media Engineering—特集 学会創立70周年記念特集 ; 映像情報メディア学会の研究会活動 : 過去から未来へ
    村上 和人, 長谷山 美紀, 田川 憲男, 田良島 周平, 石井 大祐, 映像情報メディア学会誌 = The journal of the Institute of Image Information and Television Engineers, 74, 5, 779, 783, 2020年09月
    映像情報メディア学会, 日本語
  • 地下鉄トンネル点検時の生体信号に基づいた熟練および若手技術者の分類に関する検討—A Note on Classification of Experienced and Novice Inspectors Based on Bio-signals While Inspecting in Subway Tunnels—ITS : Intelligent Transport Systems Technology
    九島 哲哉, 前田 圭介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 101, 105, 2020年02月
    電子情報通信学会, 日本語
  • 道路構造物の維持管理効率化に向けた変状画像分類における信頼性の向上に関する検討—A Note on Improvement of Reliability of Distress Image Classification for Efficient Maintenance of Road Structures—ITS : Intelligent Transport Systems Technology
    堀井 風葉, 前田 圭介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 51, 56, 2020年02月
    電子情報通信学会, 日本語
  • 画像内の物体に着目した画像検索に関する検討 : RetinaNetを用いた物体認識に基づく高精度化—A Note on Image Retrieval Focusing on Objects in Images Improving Retrieval Performance Based on Object Recognition Using RetinaNet—ITS : Intelligent Transport Systems Technology
    柳 凜太郎, 藤後 廉, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 377, 381, 2020年02月
    電子情報通信学会, 日本語
  • ゴム材料の配合量を用いたAC-GANに基づく電子顕微鏡画像の生成に関する一検討—A Note on Generation of Electron Microscope Images via Auxiliary Classifier Generative Adversarial Network with Mix Proportions—ITS : Intelligent Transport Systems Technology
    金井 美岬, 藤後 廉, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 107, 111, 2020年02月
    電子情報通信学会, 日本語
  • 道路構造物の変状評価における技術者の視線データと熟練度の分析に関する一考察—A Note on Analysis of Gaze Data and Skills of Inspectors in Distress Assessment of Road Structures—ITS : Intelligent Transport Systems Technology
    松井 太我, 前田 圭介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 97, 100, 2020年02月
    電子情報通信学会, 日本語
  • エッジの補完を導入したツイートクラスタリングの高精度化に関する検討—A Note on Tweet Clustering by Complementing Edges among Tweets—ITS : Intelligent Transport Systems Technology
    滝村 祥司, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 61, 64, 2020年02月
    電子情報通信学会, 日本語
  • 穿孔データを用いたオンライン学習に基づく岩盤の圧縮強度指数推定に関する検討—A Note on Estimation of rock compressive strength index from drilling data based on online learning—ITS : Intelligent Transport Systems Technology
    山本 健太郎, 藤後 廉, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 57, 60, 2020年02月
    電子情報通信学会, 日本語
  • サッカー映像視聴時の視線データを用いた情報の提示領域の算出に関する検討—Presentation Region Calculation of Information Based on Gaze Tracking Data in Soccer Videos—ITS : Intelligent Transport Systems Technology
    鈴木 元樹, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 91, 95, 2020年02月
    電子情報通信学会, 日本語
  • 地下鉄トンネル点検時の生体信号に基づいた熟練および若手技術者の分類に関する検討—マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス
    九島 哲哉, 前田 圭介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 44, 6, 101, 105, 2020年02月
    映像情報メディア学会, 日本語
  • Bidirectional LSTMを用いたサッカー映像におけるイベント分類に関する検討—A Note on Event Classification in Soccer Videos Using Bidirectional LSTM—ITS : Intelligent Transport Systems Technology
    春山 知生, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 371, 375, 2020年02月
    電子情報通信学会, 日本語
  • 画像注視時のヒトの感情推定のための視線特徴の推定に関する検討—A Note on Estimation of Gaze Features for Human Emotion Estimation while Viewing Images—ITS : Intelligent Transport Systems Technology
    諸戸 祐哉, 前田 圭介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 421, 85, 89, 2020年02月
    電子情報通信学会, 日本語
  • エッジの補完を導入したツイートクラスタリングの高精度化に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    滝村 祥司, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 44, 6, 61, 64, 2020年02月
    映像情報メディア学会, 日本語
  • MVBGM-MSに基づく画像注視時の脳活動データを用いた画像カテゴリの推定に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    赤松 祐亮, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 44, 6, 79, 83, 2020年02月
    映像情報メディア学会, 日本語
  • サッカー映像視聴時の視線データを用いた情報の提示領域の算出に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    鈴木 元樹, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 44, 6, 91, 95, 2020年02月
    映像情報メディア学会, 日本語
  • Bidirectional LSTMを用いたサッカー映像におけるイベント分類に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    春山 知生, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 44, 6, 371, 375, 2020年02月
    映像情報メディア学会, 日本語
  • エッジの補完を導入したツイートクラスタリングの高精度化に関する検討
    滝村祥司, 原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • Bidirectional LSTMを用いたサッカー映像におけるイベント分類に関する検討
    春山知生, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 社会インフラ維持管理効率化のための最先端AI技術の導入-点検データを用いた変状分類の精度向上に向けた取り組み-
    前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • サッカー映像視聴時の視線データを用いた情報の提示領域の算出に関する検討
    鈴木元樹, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 道路構造物の維持管理効率化に向けた変状画像分類における信頼性の向上に関する検討
    堀井風葉, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 地下鉄トンネル維持管理支援を目的とした類似画像の検索に関する検討-技術者の評価を反映可能な距離計量学習の導入-
    松本有衣, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 穿孔データを用いたオンライン学習に基づく岩盤の圧縮強度指数推定に関する検討
    山本健太郎, 藤後廉, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 地下鉄トンネル点検時の生体信号に基づいた熟練および若手技術者の分類に関する検討
    九島哲哉, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 弱異常検知アルゴリズムに基づくCCTV映像を用いた河川利用者の異常行動の検出に関する検討
    渡邊はるな, 藤後廉, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 画像注視時の視線データを用いた関心度の推定に関する検討-ラベルの逆量子化を導入したsMVCCAによる推定精度の高精度化-
    松本真直, 斉藤直輝, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 北海道大学における数理・データサイエンス教育と人材育成の取組
    長谷山美紀, 大本亨, 湧田雄基, 阿部真育, 長谷山美紀, 大本亨, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • ゴム材料の配合量を用いたAC-GANに基づく電子顕微鏡画像の生成に関する一検討
    金井美岬, 藤後廉, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 道路構造物の変状評価における技術者の視線データと熟練度の分析に関する一考察
    松井太我, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • MVBGM-MSに基づく画像注視時の脳活動データを用いた画像カテゴリの推定に関する検討
    赤松祐亮, 原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 画像内の物体に着目した画像検索に関する検討-RetinaNetを用いた物体認識に基づく高精度化-
    柳凛太郎, 藤後廉, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 画像注視時のヒトの感情推定のための視線特徴の推定に関する検討
    諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 119, 421(ITS2019 30-56), 2020年
  • 胃X線画像を用いたAIによるH.pylori感染識別と今後の展望
    藤後廉, 小川貴弘, 間部克裕, 加藤元嗣, 長谷山美紀, 日本消化器がん検診学会雑誌(Web), 58, 2, 2020年
  • 視線データと点検データの正準相関に基づく道路橋点検のための類似点検データ検索
    前田圭介, 斉藤僚汰, 高橋翔, 小川貴弘, 長谷山美紀, 土木学会論文集 F3(土木情報学)(Web), 76, 1, 2020年
  • 自己組織化マップを用いた強化学習に基づく楽曲プレイリスト生成に関する検討
    櫻井慶悟, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • 路面画像を用いた異常検知に基づく路面状態の識別に関する検討
    諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • 多層グラフ解析に基づくクロスドメイン推薦に関する検討-埋め込み特徴量の次元数の変化による精度検証-
    平川泰成, 前田圭介, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • Temporal Cycle Consistency Learningに基づく人物動作の検出に関する検討
    増田毅, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • m-SimGPを用いた特徴統合に基づくユーザの関心度推定に関する検討
    上川恭平, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • Multi-level Deep Metric Netに基づく画像の感情推定に関する検討
    LIANG Yun, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • nAULSに基づくデータセットの複雑性評価に関する検討
    LI Guang, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • RICAPに基づくデータ拡張による地下鉄トンネルにおける変状検出精度の向上に関する検討
    春山知生, 前田圭介, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • 画像注視時のfMRIデータを用いた注視画像の推定に関する検討-確率的生成モデルに基づく複数被験者の共通応答の導入-
    東孝明, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • 学習済みセマンティックセグメンテーションモデルを用いたdisentanglementに関する検討
    中川真, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2020, 2020年
  • Human-centered image classification via a neural network considering visual and biological features.
    Kazaha Horii, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, Multimedia Tools Appl., 79, 7-8, 4395, 4415, 2020年
    © 2019, Springer Science+Business Media, LLC, part of Springer Nature. In this paper, we propose a human-centered image classification via a neural network considering visual and biological features. The proposed method has two novelties. Firstly, we apply Group-Sparse Local Fisher Discriminant Analysis (GS-LFDA) to biological features. GS-LFDA realizes dimensionality reduction and noise elimination for biological features with consideration of local structures and class information. Secondly, we construct a Canonical Correlation Analysis (CCA)-based hidden layer via Discriminative Locality Preserving CCA (DLPCCA). DLPCCA transforms visual features into effective features by considering the relationships with biological information and class information. The CCA-based hidden layer enables transformation of visual features into effective features for image classification from a small number of training samples. Furthermore, once the projection can be obtained in the training phase, elimination of the need for biological data acquisition in the test phase is realized. This is another merit of our method., SPRINGER, 英語
  • 胃バリウム検査におけるAIによるHelicobacter pylori診断 (Helicobacter Topics! : 「旬のHelicobacter」を知り,驚き,理解を深め,楽しむ)
    藤後 廉, 間部 克裕, 山道 信毅, 大泉 晴史, 小川 貴弘, 長谷山 美紀, 加藤 元嗣, 坂本 直哉, Helicobacter research : Journal of helicobacter research, 23, 2, 92,133, 137, 2019年11月
    先端医学社, 日本語
  • 画像の視覚的および空間的特徴に基づくユーザに特化した注視領域推定の高精度化に関する検討 : 視覚的特徴の類似度と推定精度の関係性に関する一考察 (イメージ・メディア・クオリティ)
    諸戸 祐哉, 前田 圭介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 131, 13, 16, 2019年07月19日
    電子情報通信学会, 日本語
  • 画像注視時の視線データを用いた関心の識別に関する検討 : 推定結果の統合による高精度化 (イメージ・メディア・クオリティ)
    松本 真直, 斉藤 直輝, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 131, 17, 20, 2019年07月19日
    電子情報通信学会, 日本語
  • 敵対的生成ネットワークにより文から生成される画像の意味的評価に関する検討 (イメージ・メディア・クオリティ)
    柳 凜太郎, 藤後 廉, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 119, 131, 21, 24, 2019年07月19日
    電子情報通信学会, 日本語
  • 認識・抽出 センサから得られる視聴行動データを活用したユーザの関心推定の高度化
    長谷山 美紀, 小川 貴弘, 髙橋 翔, 原川 良介, 画像ラボ, 30, 7, 8, 12, 2019年07月
    日本工業出版, 日本語
  • Detection of gastritis by a deep convolutional neural network from double-contrast upper gastrointestinal barium X-ray radiography
    Ren Togo, Nobutake Yamamichi, Katsuhiro Mabe, Yu Takahashi, Chihiro Takeuchi, Mototsugu Kato, Naoya Sakamoto, Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, Journal of Gastroenterology, 54, 4, 321, 329, 2019年04月
    © 2018, Japanese Society of Gastroenterology. Background: Deep learning has become a new trend of image recognition tasks in the field of medicine. We developed an automated gastritis detection system using double-contrast upper gastrointestinal barium X-ray radiography. Methods: A total of 6520 gastric X-ray images obtained from 815 subjects were analyzed. We designed a deep convolutional neural network (DCNN)-based gastritis detection scheme and evaluated the effectiveness of our method. The detection performance of our method was compared with that of ABC (D) stratification. Results: Sensitivity, specificity, and harmonic mean of sensitivity and specificity of our method were 0.962, 0.983, and 0.972, respectively, and those of ABC (D) stratification were 0.925, 0.998, and 0.960, respectively. Although there were 18 false negative cases in ABC (D) stratification, 14 of those 18 cases were correctly classified into the positive group by our method. Conclusions: Deep learning techniques may be effective for evaluation of gastritis/non-gastritis. Collaborative use of DCNN-based gastritis detection systems and ABC (D) stratification will provide more reliable gastric cancer risk information., SPRINGER JAPAN KK, 英語
  • 電子顕微鏡により撮像されたゴム材料からの異常検知に基づく劣化領域の推定に関する一検討 (ITS)
    藤後 廉, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 265, 268, 2019年02月19日
    電子情報通信学会, 日本語
  • 高性能マルチセンシングバンドを利用したストレス検出の精度検証 (ITS)
    伊藤 良起, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 269, 274, 2019年02月19日
    電子情報通信学会, 日本語
  • トンネル切羽画像を用いた岩盤の穿孔エネルギー推定に関する初期検討 (ITS)
    山本 健太郎, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 291, 294, 2019年02月19日
    電子情報通信学会, 日本語
  • レーザーデータを用いた地下鉄トンネル内の変状検出に関する検討 : 全層畳み込みネットワークを用いた変状領域の可視化 (ITS)
    豊田 陽, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 295, 299, 2019年02月19日
    電子情報通信学会, 日本語
  • 複数の推定結果の統合に基づくTwitterのフォロイー推薦の高精度化に関する一検討 (ITS)
    滝村 祥司, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 307, 310, 2019年02月19日
    電子情報通信学会, 日本語
  • 3D residual networkに基づくFDG-PET/CT画像を用いた悪性腫瘍候補の自動検出
    李 宗曜, 藤後 廉, 小川 貴弘, 平田 健司, 真鍋 治, 志賀 哲, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 311, 314, 2019年02月19日
    電子情報通信学会, 英語
  • Progressive Growing GANに基づく胃炎識別のための画像生成手法に関する一検討 (ITS)
    渡邊 はるな, 藤後 廉, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 319, 322, 2019年02月19日
    電子情報通信学会, 日本語
  • 視線データを用いた画像注視時に誘起される感情の推定に関する検討 : KDLPCCAに基づく特徴変換の導入による高精度化 (ITS)
    松井 太我, 斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 323, 327, 2019年02月19日
    電子情報通信学会, 日本語
  • OpenPoseに基づくユーザの動作を用いた映像の関心度推定に関する検討 (ITS)
    九島 哲哉, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 351, 354, 2019年02月19日
    電子情報通信学会, 日本語
  • CCTV映像を用いた河川利用者の行動分類に関する検討 (ITS)
    川本 舜, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 365, 369, 2019年02月19日
    電子情報通信学会, 日本語
  • CCTV映像を用いた河川利用者の異常検出に関する検討 (ITS)
    川本 舜, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 449, 371, 374, 2019年02月19日
    電子情報通信学会, 日本語
  • 異種特徴を用いた深層学習に基づく送電鉄塔の劣化レベル分類の高精度化に関する検討
    前田圭介, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 361‐364, 2019年02月12日
    日本語
  • 異種特徴を活用したネットワーク解析に基づく音楽配信サービスにおけるアーティストの人気度予測に関する検討
    松本有衣, 原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 301‐306, 2019年02月12日
    日本語
  • 地下鉄トンネル維持管理支援のための距離計量学習を用いた類似点検データの検索に関する検討
    弦間奨, 原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 287‐290, 2019年02月12日
    日本語
  • サッカー映像視聴時の視線データを用いた攻撃選手の重要度算出に関する検討
    鈴木元樹, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 355‐359, 2019年02月12日
    日本語
  • 北海道大学における数理・データサイエンス教育の最前線~学部・大学院におけるMDS教育プログラムの基本コンセプト~
    長谷山美紀, 長谷山美紀, 大本亨, 大本亨, 湧田雄基, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 3‐4, 2019年02月12日
    日本語
  • 転移学習を用いた胃X線画像における胃炎識別に関する検討
    金井美岬, 藤後廉, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 315‐318, 2019年02月12日
    日本語
  • 畳み込みニューラルネットワークを用いた地下鉄トンネルにおける変状検出の高精度化に関する一検討
    WANG An, 原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 121‐124, 2019年02月12日
    日本語
  • 畳み込みニューラルネットワークにおける解釈性向上のための画像の属性分類に関する一検討
    堀井風葉, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 275‐279, 2019年02月12日
    日本語
  • 電子顕微鏡画像および配合量を用いたゴム材料の特性曲線の推定に関する検討
    斉藤直輝, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 261‐264, 2019年02月12日
    日本語
  • 地下鉄トンネルの変状画像を用いた技術者の注視領域推定のための初期検討―深層学習に基づく顕著領域の推定手法の適用―
    斉藤僚汰, 前田圭介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 281‐285, 2019年02月12日
    日本語
  • 電子顕微鏡画像および配合量を用いたゴム材料の特性曲線の推定に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    斉藤 直輝, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 261, 264, 2019年02月
    映像情報メディア学会, 日本語
  • 高性能マルチセンシングバンドを利用したストレス検出の精度検証 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    伊藤 良起, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 269, 274, 2019年02月
    映像情報メディア学会, 日本語
  • 畳み込みニューラルネットワークにおける解釈性向上のための画像の属性分類に関する一検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    堀井 風葉, 前田 圭介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 275, 279, 2019年02月
    映像情報メディア学会, 日本語
  • 地下鉄トンネル維持管理支援のための距離計量学習を用いた類似点検データの検索に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    弦間 奨, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 287, 290, 2019年02月
    映像情報メディア学会, 日本語
  • トンネル切羽画像を用いた岩盤の穿孔エネルギー推定に関する初期検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    山本 健太郎, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 291, 294, 2019年02月
    映像情報メディア学会, 日本語
  • 複数の推定結果の統合に基づくTwitterのフォロイー推薦の高精度化に関する一検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    滝村 祥司, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 307, 310, 2019年02月
    映像情報メディア学会, 日本語
  • A Note on Automatic Malignant Tumor Candidate Detection Based on a 3D Deep Residual Network with FDG-PET/CT Images (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    李 宗曜, 藤後 廉, 小川 貴弘, 平田 健司, 真鍋 治, 志賀 哲, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 311, 314, 2019年02月
    映像情報メディア学会, 英語
  • 転移学習を用いた胃X線画像における胃炎識別に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    金井 美岬, 藤後 廉, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 315, 318, 2019年02月
    映像情報メディア学会, 日本語
  • Progressive Growing GANに基づく胃炎識別のための画像生成手法に関する一検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    渡邊 はるな, 藤後 廉, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 319, 322, 2019年02月
    映像情報メディア学会, 日本語
  • 視線データを用いた画像注視時に誘起される感情の推定に関する検討 : KDLPCCAに基づく特徴変換の導入による高精度化 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    松井 太我, 斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 323, 327, 2019年02月
    映像情報メディア学会, 日本語
  • OpenPoseに基づくユーザの動作を用いた映像の関心度推定に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    九島 哲哉, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 351, 354, 2019年02月
    映像情報メディア学会, 日本語
  • サッカー映像視聴時の視線データを用いた攻撃選手の重要度算出に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    鈴木 元樹, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 355, 359, 2019年02月
    映像情報メディア学会, 日本語
  • 異種特徴を用いた深層学習に基づく送電鉄塔の劣化レベル分類の高精度化に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    前田 圭介, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 361, 364, 2019年02月
    映像情報メディア学会, 日本語
  • CCTV映像を用いた河川利用者の行動分類に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    川本 舜, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 365, 369, 2019年02月
    映像情報メディア学会, 日本語
  • CCTV映像を用いた河川利用者の異常検出に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    川本 舜, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 43, 5, 371, 374, 2019年02月
    映像情報メディア学会, 日本語
  • 北海道大学におけるデータサイエンス人材育成の取組-創造人材育成基盤構築:大学教育の新機能実装の試み-
    長谷山美紀, 長谷山美紀, 大本亨, 大本亨, 湧田雄基, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 2019年
  • 北海道大学における博士等人材育成の取組-次世代スマートインフラ管理人材育成コンソーシアム-
    長谷山美紀, 長谷山美紀, 大本亨, 大本亨, 湧田雄基, 電子情報通信学会技術研究報告, 118, 449(ITS2018 59-85), 2019年
  • ユーザの好みを反映した潜在特徴を用いたGCNに基づくTumblrポストの推薦
    大友一馬, 原川良介, 小川貴弘, 長谷山美紀, 岩橋政宏, 信号処理シンポジウム講演論文集(CD-ROM), 34th, 2019年
  • 変状分類におけるGrad-CAM++に基づいたCNNの注目領域の可視化に関する検討
    小川直輝, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • サッカー映像視聴時の視線データを用いた周辺視に基づく攻撃選手の重要度算出に関する検討
    鈴木元樹, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • 画像注視時の視線データを用いた関心の識別に関する検討-LDCCAに基づく特徴量の射影による高精度化-
    松本真直, 斉藤直輝, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • Sparse Bayesian Learningに基づく注視領域の時間変化を考慮したヒトの感情推定に関する検討
    諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • 複数の特徴量から得られる類似度の統合に基づくサッカー映像における類似場面検索の高精度化に関する検討
    春山知生, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • 複数変量の生成モデルに基づく画像注視時の脳活動データを用いた画像カテゴリの推定に関する検討
    赤松祐亮, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • Text-to-imageGANに基づくスタイル変換に関する検討-Image-to-textモデル導入による高精度化-
    古寺恵, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • Semantic Segmentationに基づく地下鉄トンネルにおける変状検出に関する検討
    WANG An, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • 脳活動データを用いた注視画像の再構成における用いる視覚野の領域に関する検討
    高田紗弥, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • Twitterを用いた異常検知に基づく野球映像の重要シーン検出に関する検討
    平澤魁人, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2019, 2019年
  • AI・IoT・ビッグデータ解析に基づいた次世代の社会インフラ維持管理技術
    長谷山美紀, 電子情報通信学会大会講演論文集(CD-ROM), 2019, 2019年
  • 生体情報解析を導入した次世代AI技術の構築
    長谷山美紀, 小川貴弘, 電子情報通信学会大会講演論文集(CD-ROM), 2019, 2019年
  • Novel Audio Feature Projection Using KDLPCCA-Based Correlation with EEG Features for Favorite Music Classification.
    Ryosuke Sawata, Takahiro Ogawa, Miki Haseyama, IEEE Trans. Affective Computing, 10, 3, 430, 444, 2019年
    IEEE A novel audio feature projection using Kernel Discriminative Locality Preserving Canonical Correlation Analysis (KDLPCCA)-based correlation with electroencephalogram (EEG) features for favorite music classification is presented in this paper. The projected audio features reflect individual music preference adaptively since they are calculated by considering correlations with the user & #x0027;s EEG signals during listening to musical pieces that the user likes/dislikes via a novel CCA proposed in this paper. The novel CCA, called KDLPCCA, can consider not only a non-linear correlation but also local properties and discriminative information of each class sample, namely, music likes/dislikes. Specifically, local properties reflect intrinsic data structures of the original audio features, and discriminative information enhances the power of the final classification. Hence, the projected audio features have an optimal correlation with individual music preference reflected in the user & #x0027;s EEG signals, adaptively. If the KDLPCCA-based projection that can transform original audio features into novel audio features is calculated once, our method can extract projected audio features from a new musical piece without newly observing individual EEG signals. Our method therefore has a high level of practicability. Consequently, effective classification of user & #x0027;s favorite musical pieces via a Support Vector Machine (SVM) classifier using the new projected audio features becomes feasible. Experimental results show that our method for favorite music classification using projected audio features via the novel CCA outperforms methods using original audio features, EEG features and even audio features projected by other state-of-the-art CCAs., IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 英語
  • Classification of tourism categories based on heterogeneous features considering existence of reliable results
    Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama, Proceedings of SPIE - The International Society for Optical Engineering, 11049, 2019年01月01日
    © COPYRIGHT SPIE. This paper presents a classification method of tourism categories based on heterogeneous features considering existence of reliable results. The proposed method performs estimation of existence of reliable results based on one-versus-one scheme from three kinds of classification results obtained from tourism images, geotags and textual tags, separately. Then if the reliable result is included in the above results, this result is regarded as a final result. Otherwise, the final result is obtained by the multiple annotator logistic regression. The proposed method realizes accurate classification by estimating the existence of reliable results from more than two kinds of results., SPIE-INT SOC OPTICAL ENGINEERING, 英語
  • Field position estimation in soccer videos using convolutional neural network-based image features
    Genki Suzuki, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, Proceedings of SPIE - The International Society for Optical Engineering, 11049, 2019年01月01日
    © COPYRIGHT SPIE. This paper presents a novel estimation method of field positions in soccer videos using Convolutional Neural Network (CNN)-based image features. CNN-based features have been well known to be ei€ective for tasks in machine learning. Therefore, the proposed method adopts CNN-based image features. By using these image features, the proposed method enables accurate estimation of soccer field positions than handcrafted features, i.e., Hough transform-based features. We show the ei€ectiveness of our method via experiment results using actual soccer videos., SPIE-INT SOC OPTICAL ENGINEERING, 英語
  • Gaze-based visual feature extraction via DLPCCA for visual sentiment estimation
    Taiga Matsui, Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama, Proceedings of SPIE - The International Society for Optical Engineering, 11049, 2019年01月01日
    © COPYRIGHT SPIE. This paper presents gaze-based visual feature extraction via Discriminative Locality Preserving Canonical Correlation Analysis (DLPCCA) for visual sentiment estimation. The proposed method calculates novel visual features reflecting users' visual sentiment by applying DLPCCA to gaze and original visual features. Consequently, accurate visual sentiment estimation becomes feasible by utilizing the novel visual features derived by the proposed method., SPIE-INT SOC OPTICAL ENGINEERING, 英語
  • Automatic Metastatic Bone Tumor Classification with DCNN-based Features Using Treatment-planning CT Images
    Haruna Watanabe, Ren Togo, Takahiro Ogawa, Miki Haseyama, Koichi Yasuda, Khin Khin Tha, Kohsuke Kudo, Hiroki Shirato, INTERNATIONAL FORUM ON MEDICAL IMAGING IN ASIA 2019, 11050, 2019年
    In this paper, we propose a method to classify metastatic bone tumors using treatment-planning computed tomography images. The proposed method utilizes pre-trained deep convolutional neural network (DCNN) models as feature extractors and enables the metastatic bone tumor classification by using the obtained features. Performance of several state-of-the-art DCNN-based features was compared and evaluated in our experiment., SPIE-INT SOC OPTICAL ENGINEERING, 英語
  • Multi-classifier Decision: Integration of Multiple Brain Activity-based Classifications
    Takahiro Ogawa, Kento Sugata, Ren Togo, Miki Haseyama, ITE Transactions on Media Technology and Applications, 7, 1, 36, 44, 2019年01月01日
    Copyright © 2019 by ITE Transactions on Media Technology and Applications (MTA) A novel method that integrates brain activity-based classifications obtained from multiple users is presented in this paper. The proposed method performs decision-level fusion (DLF) of the classifications using a kernelized version of extended supervised learning from multiple experts (KESLME), which is newly derived in this paper. In this approach, feature-level fusion of multiuser electroencephalogram (EEG) features is performed by multiset supervised locality preserving canonical correlation analysis (MSLPCCA). In the proposed method, the multiple classification results are obtained by classifiers separately constructed for the multiuser EEG features. Then DLF of these classification results becomes feasible based on KESLME, which can provide the final decision with consideration of the relationship between the MSLPCCA-based integrated EEG features and each classifier’s performance. In this way, a new multi-classifier decision technique, which depends only on users’ brain activities, is realized, and the performance in an image classification task becomes comparable to that of Inception-v3, one of the state-of-the-art deep convolutional neural networks., INST IMAGE INFORMATION & TELEVISION ENGINEERS, 英語
  • User-centric Visual Attention Estimation Based on Relationship between Image and Eye Gaze Data
    Yuya Moroto, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 388, 389, 2018年12月12日
    © 2018 IEEE. This paper presents a method for estimating user-centric visual attention based on the relationship between image and eye gaze data. The proposed method focuses on relationship between visual features calculated from images and saliency values calculated from eye gaze data. Specifically, our method calculates the saliency map of each training image by using individual eye gaze data obtained from only these images. Furthermore, from the pairs of visual features and the gaze-based saliency, the estimation of user-centric saliency from a new test image becomes feasible. Our contribution is the construction of a simple but successful estimation model which can train the relationship from limited amount of individual eye gaze data. Experimental results show the effectiveness of the proposed method., IEEE, 英語
  • Missing Image Data Estimation via Iterative Convolutional Sparse Coding
    Masanao Matsumoto, Naoki Saito, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 331, 333, 2018年12月12日
    © 2018 IEEE. A novel method for missing image data estimation is presented in this paper. The proposed method realizes accurate estimation of missing image data by iterating dictionary learning and Convolutional Sparse Coding (CSC). Specifically, our method iterates estimation of missing image data via CSC by using a dictionary that is constructed from a target image, and reconstruction of the dictionary by using the obtained estimation results. As the main contribution of our paper, the proposed method enables the missing image data estimation by using more suitable dictionaries obtained by this iterative scheme. Experimental results show high missing image data estimation performance by the proposed method., IEEE, 英語
  • Detection of Deformed PPG Waveforms Based on a Ratio of Their Average Accelerations
    Ken Kawakami, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 40, 44, 2018年12月12日
    © 2018 IEEE. This paper presents a new method to detect deformed Photoplethysmogram (PPG) waveforms for sufficient accuracy of signal processing. The PPG waveforms have been applied in many health indicators, such as blood pressure, blood viscosity and blood vessel elasticity. Usually, the measurements using a sensitive signals require user awareness so that all the PPG waveforms are kept accurate. Namely, accuracy of the calculated indicators becomes lower when the PPG waveform is deformed due to motion artifacts. In particular, detection methods of deformed PPG waveforms are important for incorporating the health indicators into general fitness trackers to find the correct waveform or to remove deformed PPG waveforms from the measurement. Therefore, we propose a new method which detects a badly formed PPG waveform by monitoring a ratio of average accelerations. Experimental results show the effectiveness of the method for detecting a deformed PPG waveform., IEEE, 英語
  • Team Tactics Estimation in Soccer Videos via Deep Extreme Learning Machine Based on Players Formation
    Genki Suzuki, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 289, 290, 2018年12月12日
    © 2018 IEEE. A method of team tactics estimation in soccer videos is presented in this paper. Our method enables estimation of basic tactics in each team on the basis of the Deep-Extreme Learning Machine (DELM) by using features of players formation. In the soccer games, team tactics relate to each other team. Therefore, the proposed method obtains final estimation results by utilizing two DELMs of each team and their relationship. Since the proposed method takes into consideration the relevance of the estimated tactics in each team, we realize accurate tactics estibimation. Experimental results using actual soccer videos showed the effectiveness of our method., IEEE, 英語
  • Blood Circulation Based on PPG Signals for Thermal Comfort Evaluation
    Ken Kawakami, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 198, 199, 2018年12月12日
    © 2018 IEEE. This paper presents a new index for monitoring transition of blood circulation from Photoplethysmogram (PPG) signals for thermal comfort evaluation of users. Heat dissipation reaction through the dilation of blood vessels is person's intrinsic ability to control the thermal comfort. When body temperature is higher than normal temperature, blood circulation changes according to the dilation of blood vessels in distal end of the extremities. Blood circulation is often evaluated by an index of peripheral resistance corresponding to changes in blood flow velocity such as systolic/diastolic ratio S/D of flow velocities, resistance index and the pulsatility index. Unfortunately, such an index cannot be utilized in daily life for healthcare with using fitness trackers since the blood flow velocity is measured by either an ultrasonic Doppler blood flowmeter (UDF) or a Laser-Doppler flowmeter. Therefore, we propose a new index which is easily acquirable from PPG signals. First, a couple of variables correlating to the blood flow velocity is calculated from a rate of volumetric strain of Photoplethysmogram signals. Then the new index can be obtained as difference of these variables. Experimental results show the effectiveness of this index by confirming high correlation with S/D of UDF., IEEE, 英語
  • Estimation of Viewed Image Categories via CCA Using Human Brain Activity
    Yusuke Akamatsu, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 159, 160, 2018年12月12日
    © 2018 IEEE. This paper presents a method to estimate viewed image categories via canonical correlation analysis (CCA) using human brain activity measured by functional magnetic resonance imaging (fMRI). The proposed method enables estimation of image categories that a subject viewed by using only the subject's brain activity. Specifically, the proposed method calculates the projection matrices that enable direct comparison between human brain activity and images that subjects viewed through CCA. After projecting the human brain activity and the viewed images on the same latent space, k-Nearest Neighbor (k-NN) is performed to estimate the viewed image categories from only human brain activity. Through the projection matrices, the proposed method can increase training data for k-NN even if a large number of pairs of human brain activity and images cannot be prepared. Experimental results for ten subjects show the effectiveness of the proposed method., IEEE, 英語
  • Estimation of Important Scenes in Soccer Videos Based on Collaborative Use of Audio-Visual CNN Features
    Tomoki Haruyama, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 710, 711, 2018年12月12日
    © 2018 IEEE. This paper presents a novel method for estimating important scenes in soccer videos based on collaborative use of audio-visual Convolutional Neural Network (CNN) features. In soccer games, since game situations influence not only players' movements but also audiences' cheers, analyses of their audio and visual sequences are useful for the estimation of important scenes. In our method, such scenes are estimated from audio and visual CNN features via support vector machine (SVM) in each feature. Furthermore, by applying weighted majority voting based on confidences defined from the SVM-based estimation results, accurate estimation of important scenes becomes feasible. Experimental results show the effectiveness of our method., IEEE, 英語
  • Twitter Followee Recommendation Based on Multimodal FFM Considering Social Relations
    Shoji Takimura, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018, 196, 197, 2018年12月12日
    © 2018 IEEE. A method for Twitter followee recommendation based on multimodal field-aware factorization machines considering social relations (MFFM-SR) is presented. MFFM-SR enables collaborative use of textual and visual features and social relations unlike conventional methods. Specifically, for distinguishing users' interest, visual features are extracted from images in their tweets and icons as well as textual features and social relations. Furthermore, to construct a model that accurately represents users' interest, MFFM-SR that enables calculation of high-level features via estimation of latent relationships among the obtained features and social relations is derived. By using the constructed model, successful followee recommendation becomes feasible., IEEE, 英語
  • Binary sparse representation based on arbitrary quality metrics and its applications
    Takahiro Ogawa, Sho Takahashi, Naofumi Wada, Akira Tanaka, Miki Haseyama, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E101A, 11, 1776, 1785, 2018年11月01日
    © 2018 The Institute of Electronics, Information and Communication Engineers. Binary sparse representation based on arbitrary quality metrics and its applications are presented in this paper. The novelties of the proposed method are twofold. First, the proposed method newly derives sparse representation for which representation coefficients are binary values, and this enables selection of arbitrary image quality metrics. This new sparse representation can generate quality metric-independent subspaces with simplification of the calculation procedures. Second, visual saliency is used in the proposed method for pooling the quality values obtained for all of the parts within target images. This approach enables visually pleasant approximation of the target images more successfully. By introducing the above two novel approaches, successful image approximation considering human perception becomes feasible. Since the proposed method can provide lower-dimensional subspaces that are obtained by better image quality metrics, realization of several image reconstruction tasks can be expected. Experimental results showed high performance of the proposed method in terms of two image reconstruction tasks, image inpainting and super-resolution., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • Automatic detection of fish sounds based on multi-stage classification including logistic regression via adaptive feature weighting
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, Tomonari Akamatsu, Journal of the Acoustical Society of America, 144, 5, 2709, 2718, 2018年11月01日
    © 2018 Acoustical Society of America. This paper presents a method for automatic detection of fish sounds in an underwater environment. There exist two difficulties: (i) features and classifiers that provide good detection results differ depending on the underwater environment and (ii) there are cases where a large amount of training data that is necessary for supervised machine learning cannot be prepared. A method presented in this paper (the proposed hybrid method) overcomes these difficulties as follows. First, novel logistic regression (NLR) is derived via adaptive feature weighting by focusing on the accuracy of classification results by multiple classifiers, support vector machine (SVM), and k-nearest neighbors (k-NN). Although there are cases where SVM or k-NN cannot work well due to divergence of useful features, NLR can produce complementary results. Second, the proposed hybrid method performs multi-stage classification with consideration of the accuracy of SVM, k-NN, and NLR. The multi-stage acquisition of reliable results works adaptively according to the underwater environment to reduce performance degradation due to diversity of useful classifiers even if abundant training data cannot be prepared. Experiments on underwater recordings including sounds of Sciaenidae such as silver croakers (Pennahia argentata) and blue drums (Nibea mitsukurii) show the effectiveness of the proposed hybrid method., ACOUSTICAL SOC AMER AMER INST PHYSICS, 英語
  • 画像注視時の注視領域の時間変化を考慮したテンソル解析に基づく感情推定に関する検討
    諸戸祐哉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, ROMBUNNO.92, 2018年10月27日
    日本語
  • 地下鉄トンネルの点検における視線データを用いた熟練度の分析に関する一考察
    斉藤僚汰, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, ROMBUNNO.11, 2018年10月27日
    日本語
  • 深層学習に基づく画像特徴量を利用した放射線治療用CT画像における転移性骨腫瘍の検出に関する検討
    渡邊はるな, 藤後廉, 小川貴弘, 長谷山美紀, 安田耕一, THA Khin Khin, 工藤與亮, 白土博樹, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, ROMBUNNO.87, 2018年10月27日
    日本語
  • AC‐GANに基づく胃炎識別のための画像生成に関する検討
    金井美岬, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, ROMBUNNO.89, 2018年10月27日
    日本語
  • Tri‐trainingに基づく胃X線画像を用いた胃炎の識別に関する検討
    LI Zongyao, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, ROMBUNNO.88, 2018年10月27日
    日本語
  • AttnGANを用いたシーン検索に関する検討―再検索の導入による高精度化―
    柳凜太郎, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, ROMBUNNO.10, 2018年10月27日
    日本語
  • Simultaneous Realization of Multiple Music Video Applications Based on Heterogeneous Network Analysis Via Latent Link Estimation
    Yui Matsumoto, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, Proceedings - IEEE International Conference on Multimedia and Expo, 2018-July, 1, 6, 2018年10月08日
    © 2018 IEEE. To help users seek desired music videos and create attractive music videos, many methods that realize applications such as music video recommendation, captioning and generation have been proposed. In this paper, a novel method that realizes these applications simultaneously on the basis of heterogeneous network analysis via latent link estimation is proposed. To the best of our knowledge, this work is the first attempt to realize music video recommendation, captioning and generation simultaneously. The proposed method enables latent link estimation with consideration of multimodal information and multiple social metadata obtained from music videos via Laplacian multiset canonical correlation analysis. Thus, it becomes feasible to construct a heterogeneous network that enables direct comparison of audio, visual and textual information of music videos and user information on the same feature space. Furthermore, link prediction on the obtained heterogeneous network enables association with (i) user information and their desired audio information; (ii) audio information and textual information that describes contents of musical pieces; and (iii) audio information and visual information that represents contents of musical pieces visually. As a result, support for (i) music video recommendation; (ii) captioning; and (iii) generation becomes feasible, respectively. Experimental results for a real-world dataset constructed by using YouTube-8M show the effectiveness of the proposed method., IEEE Computer Society
  • Interest Level Estimation of Items via Matrix Completion Based on Adaptive User Matrix Construction
    Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, Proceedings - IEEE International Conference on Multimedia and Expo, 2018-July, 1, 6, 2018年10月08日
    © 2018 IEEE. This paper presents a novel method for interest level estimation of items via matrix completion based on adaptive user matrix construction. The proposed method introduces a new criterion for adaptively constructing a user matrix that consists of user behavior features and interest levels, which are evaluated by target users and similar users. In the estimation, the matrix completion via rank minimization using the truncated nuclear norm is applied to the constructed matrix. The proposed method enables both of the interest level estimation of the target users and the selection of the similar users suitable for the estimation by monitoring errors caused in the matrix completion algorithm. The caused errors indicate the minimum differences between the estimated interest levels and true ones, and they can be regarded as the criterion for both of the optimal estimation and the adaptive selection. Furthermore, the proposed method uses weight matrices for decreasing an influence of missing data on the estimation. Consequently, accurate estimation of the interest levels becomes feasible by using the adaptively constructed matrix. Experimental results obtained by applying the proposed method to users' behavior and interest data show the effectiveness of the proposed method., IEEE Computer Society
  • Semi-Supervised Multiple Feature Fusion for Video Preference Estimation
    Akira Toyoda, Takahiro Ogawa, Miki Haseyama, ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 2018-April, 891, 895, 2018年09月10日
    © 2018 IEEE. This paper presents a new method to estimate user preferences for videos based on multiple feature fusion via semi-supervised Multiview Local Fisher Discriminant Analysis (sMvLFDA). The proposed method first extracts multiple visual features from videos and functional near-infrared spectroscopy (fNIRS) features from fNIRS signals recorded during watching videos. Next, we apply Locality Preserving Canonical Correlation Analysis (LPCCA) to each visual feature and fNIRS features and project each visual feature to the new feature spaces (fNIRS-based visual feature spaces). Consequently, since the correlation between each visual feature and fNIRS features which reflect user preferences is maximized, we can transform visual features into features which also reflect user preferences. In addition, we newly introduce sMvLFDA and fuse multiple fNIRS-based visual features via sMvLFDA. sMvLFDA fuses features while using labeled samples and unlabeled samples simultaneously to reduce overfitting to the labeled samples. Furthermore, sMvLFDA adequately uses complementary properties in multiple features. Therefore, it can be expected that the fused features are more effective for estimation of user preferences than each fNIRS-based visual feature. The main contribution of this paper is the new derivation of sMvLFDA. Consequently, by using the fused features, it becomes feasible to estimate user preferences for videos successfully., IEEE, 英語
  • Sfemcca: Supervised Fractional-Order Embedding Multiview Canonical Correlation Analysis for Video Preference Estimation
    Yoshiki Ito, Takahiro Ogawa, Miki Haseyama, ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 2018-April, 3086, 3090, 2018年09月10日
    © 2018 IEEE. In this paper, we present supervised fractional-order embedding multiview canonical correlation analysis (SFEMCCA). SFEMCCA is a CCA method realizing the following three points: (1) learning noisy data with small number of samples and large number of dimensions, (2) multiview learning that can integrate three or more kinds of features, and (3) supervised learning using labels corresponding to the samples. In real data, it is necessary to deal with high dimensional noisy data with limited number of samples, and there are many cases where three or more kinds of multimodal and supervised data are treated in order to calculate more accurate projections. Therefore, SFEMCCA, which takes the above advantages (1)-(3) into account, is effective for data obtained from real environments. From experimental results, it was confirmed that accuracy improvements using SFEMCCA were statistically significant compared to the several conventional methods of supervised multiview CCA., IEEE, 英語
  • A Human-Centered Neural Network Model with Discriminative Locality Preserving Canonical Correlation Analysis for Image Classification
    Kazaha Horii, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2366, 2370, 2018年08月29日
    © 2018 IEEE. This paper presents a human-centered neural network model with discriminative locality preserving canonical correlation analysis (DLPCCA) for image classification. Although construction of multiple hidden layers adopted in recent deep learning methods is effective for extracting semantic features, a large amount of training images is required. In order to extract effective features for image classification successfully from a small amount of training images, the proposed method transforms visual features by using biological information obtained from image viewers as auxiliary information. The proposed method consists of two hidden layers. By constructing the first hidden layer, which can maximize canonical correlation between visual features and features based on biological information, the effective feature transformation can be realized. Specifically, the proposed method uses DLPCCA, which considers label information and preserves local structures. The second hidden layer constructed based on Extreme Learning Machine (ELM) enables classification. Consequently, since the first hidden layer performs the effective feature transformation, the proposed neural network model realizes accurate image classification from a quite small amount of training images., IEEE, 英語
  • Anonymous Gastritis Image Generation via Adversarial Learning from Gastric X-Ray Images
    Ren Togo, Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2082, 2086, 2018年08月29日
    © 2018 IEEE. This paper presents an anonymous gastritis image generation method based on a generative adversarial network approach. Since clinical individual data include highly confidential information, they must be handled carefully. Although data sharing is demanded to construct large-scale medical image datasets for deep learning-based recognition tasks, managing and annotating these data have been conducted manually. The proposed method enables the generation of anonymous images by an adversarial learning approach. Experimental results show that generated images by our method contribute to a gastritis recognition task. This will be helpful for constructing large-scale medical image datasets effectively., IEEE, 英語
  • Anonymous Image Data Generation from Gastric X-Ray Images for Improving Gastritis Recognition Performance
    Ren Togo, Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, 2018 IEEE International Conference on Consumer Electronics-Taiwan, ICCE-TW 2018, 2018年08月27日
    © 2018 IEEE. This paper presents an anonymous gastritis image generation method for improving gastritis recognition performance. We realize the generation of realistic gastritis images by considering label information. Experimental results showed that anonymous images generated by our method had a potential for a gastritis recognition task. Concretely, the recognition performance of a classifier constructed with the anonymous images outperformed the performance of the conventional image generation method-based classifier., IEEE, 英語
  • Estimation of Deterioration Levels of Transmission Towers via Deep Learning Maximizing Canonical Correlation between Heterogeneous Features
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, IEEE Journal on Selected Topics in Signal Processing, 12, 4, 633, 644, 2018年08月01日
    © 2007-2012 IEEE. This paper presents estimation of deterioration levels of transmission towers via deep learning maximizing the canonical correlation between heterogeneous features. In the proposed method, we newly construct a correlation-maximizing deep extreme learning machine (CMDELM) based on a local receptive field (LRF). For accurate deterioration level estimation, it is necessary to obtain semantic information that effectively represents deterioration levels. However, since the amount of training data for transmission towers is small, it is difficult to perform feature transformation by using many hidden layers such as general deep learning methods. In CMDELM-LRF, one hidden layer, which maximizes the canonical correlation between visual features and text features obtained from inspection text data, is newly inserted. Specifically, by using projections obtained by maximizing the canonical correlation as weight parameters of the hidden layer, feature transformation for extracting semantic information is realized without designing many hidden layers. This is the main contribution of this paper. Consequently, CMDELM-LRF realizes accurate deterioration level estimation from a small amount of training data., IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 英語
  • 依頼講演 低次元画像近似に基づいたインペインティングとその工学的応用 (イメージ・メディア・クオリティ)
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 118, 147, 1, 4, 2018年07月20日
    電子情報通信学会, 日本語
  • Tourism category classification on image sharing services through estimation of existence of reliable results
    Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama, ICMR 2018 - Proceedings of the 2018 ACM International Conference on Multimedia Retrieval, 493, 496, 2018年06月05日
    © 2018 ACM. A new tourism category classification method through estimation of existence of reliable classification results is presented in this paper. The proposed method obtains two kinds of classification results by applying a convolutional neural network to tourism images and applying a Fuzzy K-nearest neighbor algorithm to geotags attached to the tourism images. Then the proposed method estimates existence of reliable classification results in the above two results. If the reliable result is included, the result is selected as the final classification result. If any reliable result is not included, the final result is obtained by another approach based on a multiple annotator logistic regression model. Consequently, the proposed method enables accurate classification based on the new estimation scheme., ASSOC COMPUTING MACHINERY, 英語
  • Sentiment-aware personalized tweet recommendation through multimodal FFM
    Ryosuke Harakawa, Daichi Takehara, Takahiro Ogawa, Miki Haseyama, Multimedia Tools and Applications, 77, 14, 1, 19, 2018年03月29日
    For realizing quick and accurate access to desired information and effective advertisements or election campaigns, personalized tweet recommendation is highly demanded. Since multimedia contents including tweets are tools for users to convey their sentiment, users’ interest in tweets is strongly influenced by sentiment factors. Therefore, successful personalized tweet recommendation can be realized if sentiment in tweets can be estimated. However, sentiment factors were not taken into account in previous works and the performance of previous methods may be limited. To overcome the limitation, a method for sentiment-aware personalized tweet recommendation through multimodal Field-aware Factorization Machines (FFM) is newly proposed in this paper. Successful personalized tweet recommendation becomes feasible through the following three contributions: (i) sentiment factors are newly introduced into personalized tweet recommendation, (ii) users’ interest is modeled by deriving multimodal FFM that enables collaborative use of multiple factors in a tweet, i.e., publisher, topic and sentiment factors, and (iii) the effectiveness of using sentiment factors as well as publisher and topic factors is clarified from results of experiments using real-world datasets related to worldwide hot topics, “#trump”, “#hillaryclinton” and “#ladygaga”. In addition to showing the effectiveness of the proposed method, the applicability of the proposed method to other tasks such as advertisement and social analysis is discussed as a conclusion and future work of this paper., Springer New York LLC, 英語
  • Tag refinement based on multilingual tag hierarchies extracted from image folksonomy
    Shota Hamano, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2017-, 1327, 1331, 2018年02月20日
    This paper presents a novel method for tag refinement using multilingual sources of tagged images in an image folksonomy. The proposed method enables accurate tag refinement by effectively leveraging multilingual sources of tags and considering the hierarchical structure of tags in the following way. First, synonymous tags across different languages are detected based on similarities between tagged images. In this stage, the proposed method utilizes visual similarities to effectively detect synonymous tags since the visual features extracted from images should be similar if they are assigned tags with the same meaning in different languages. Then hierarchical structure of the tags are extracted based on the similarity between the detected synonymous tags. The hierarchical structure provides hypernymous and hyponymous tags of the target tags, which are important for considering the relevance between tags and images. Consulting the hierarchical structure enables removal of irrelevant tags from the images and assignment of relevant tags to the images. The proposed method effectively utilizes tags in various languages in an image folksonomy. Experimental results show the effectiveness of introducing multilingual sources of tagged images for accuracy improvement in tag refinement., IEEE Computer Society, 英語
  • Image retrieval based on LRGA algorithm and relevance feedback for insect identification
    Susumu Gerund, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2017-, 3978, 3982, 2018年02月20日
    This paper presents an image retrieval method based on local regression and global alignment (LRGA) algorithm and relevance feedback for insect identification. Based on LRGA algorithm, the proposed method enables estimation of ranking scores for image retrieval in such a way that the neighborhood structure of the database can be optimally preserved. This is the biggest contribution of this paper. Then our method measures relevance between the query image and all the images in the database and realizes retrieval of images based on the measured relevance. Furthermore, if positively labeled images obtained by a user are available, they are used as the query relevance information for the relevance feedback to improve the retrieval results. Experimental results show the effectiveness of our method., IEEE Computer Society, 英語
  • MvLFDA-based video preference estimation using complementary properties of features
    Akira Toyoda, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2017-, 635, 639, 2018年02月20日
    This paper presents a new method to estimate users' video preferences using complementary properties of features via Multiview Local Fisher Discriminant Analysis (MvLFDA). The proposed method first extracts multiple visual features from video frames and electroencephalogram (EEG) features from users' EEG signals recorded during watching video. Then we calculate EEG-based visual features by applying Locality Preserving Canonical Correlation Analysis (LPCCA) to each visual feature and EEG features. The EEG-based visual features reflect users' preferences since the correlation between visual features and EEG features which reflect users' preferences is maximized. Next, MvLFDA, which is newly derived in this paper, integrates multiple EEG-based visual features. Since MvLFDA explores complementary properties of different features, it can be expected that the features obtained by integrating multiple EEG-based visual features are more effective for users' preference estimation than each EEG-based visual feature. The biggest contribution of this paper is the new derivation of MvLFDA. Then successful estimation of users' video preferences becomes feasible using features obtained by MvLFDA., IEEE Computer Society, 英語
  • Automatic estimation of deterioration level on transmission towers via deep extreme learning machine based on local receptive field
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2017-, 2379, 2383, 2018年02月20日
    This paper presents an automatic estimation method of deterioration levels on transmission towers via Deep Extreme Learning Machine based on Local Receptive Field (DELM-LRF). Although Convolutional Neural Network (CNN) requires a large number of training images, it is difficult to prepare a sufficient number of training images of transmission towers. Thus, we generate a novel estimation method which enables training from a small number of training images. Specifically, we automatically extract image features based on Local Receptive Field (LRF) which combines convolution and pooling without using hand-craft features and estimate deterioration levels via Deep Extreme Learning Machine (DELM), which is a part of efficient deep learning methods. The derivation of DELM-LRF is the biggest contribution of this paper, and it can be trained from less training images compared to CNN. Experimental results show the effectiveness of DELM-LRF for the estimation of deterioration levels on transmission towers. Consequently, the proposed method makes it possible to approach challenging tasks with high expertise having difficulty in preparing enough images., IEEE Computer Society, 英語
  • Detection of gastric cancer risk from X-ray images via patch-based convolutional neural network
    Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2017-, 2055, 2059, 2018年02月20日
    This paper presents a novel detection method of gastric cancer risk from X-ray images using the patch-based Convolutional Neural Network (CNN). Our method enables the training of the patch-based CNN which can accurately detect gastric cancer risk even though there is only the image-level ground truth. Furthermore, the proposed method can extract a feature vector that can represent the whole of symptoms associated with the presence or absence of the risk. Specifically, the proposed method selects the patches related to their true risk via the CNN, and it is the most innovative contribution of our method. Moreover, we extract the feature vector by applying the Bag-of-Feature representation to the output values from the CNN's intermediate layer obtained from the selected patches. Finally, the detection of gastric cancer risk is performed by inputting the extracted feature vector into Support Vector Machine. Experimental results confirm that the proposed method outperforms a previously reported method that combines the detection results obtained from X-ray images taken from multiple angles even though the proposed method only uses an X-ray image taken from a single angle, and we can achieve a higher performance than that of doctors., IEEE Computer Society, 英語
  • Automatic martian dust storm detection via decision level fusion basedondeep extreme learning machine
    Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, Proceedings - International Conference on Image Processing, ICIP, 2017-, 435, 439, 2018年02月20日
    This paper presents an automatic Martian dust storm detection via decision level fusion (DLF) based on deep extreme learning machine (DELM). Since Martian images are taken in multi-wavelength bands, DLF techniques which output a final classification result by integrating multiple classification results are necessary. Furthermore, since the number of Martian images taken by satellites is different for each region, the number of the classification results to be integrated is different. Thus, we present a new DLF framework based on confidence values of the classification results. Specifically, we generate multiple extreme learning machines with kernel classifiers to obtain their classification results. Moreover, we monitor the classification results as confidence values and select the same number of the classification results with high confidence for each region. Finally, these selected results can be integrated by using a DLF based on DELM, which is a multilayered ELM. This integration framework is the biggest contribution of our method. Experimental results show the effectiveness of the DLF based on DELM., IEEE Computer Society, 英語
  • アクティブネットを用いたラグビー映像におけるパス可能領域の推定に関する検討 (画像工学)
    高橋 翔, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 432, 137, 142, 2018年02月15日
    電子情報通信学会, 日本語
  • LRGAアルゴリズムを用いた昆虫同定のための類似画像検索に関する検討 : データ拡張による検索精度向上の検証 (ITS)
    弦間 奨, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 167, 171, 2018年02月15日
    電子情報通信学会, 日本語
  • 背景差分法と深層学習による歩行者検出を用いた河川CCTV映像における歩行者追跡に関する検討 (ITS)
    川本 舜, 石原 賢太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 179, 183, 2018年02月15日
    電子情報通信学会, 日本語
  • 道路構造物に発生する変状の自動分類の高精度化に向けたConvolutional Sparse Codingの導入に関する検討 (ITS)
    前田 圭介, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 189, 194, 2018年02月15日
    電子情報通信学会, 日本語
  • 再帰型ニューラルネットワークを用いたサッカー映像における基本戦術の推定に関する検討 (ITS)
    鈴木 元樹, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 131, 135, 2018年02月15日
    電子情報通信学会, 日本語
  • 深層学習を用いた画像共有サービスに投稿される観光画像のカテゴリ分類の高精度化に関する検討 (ITS)
    斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 161, 165, 2018年02月15日
    電子情報通信学会, 日本語
  • 映像視聴時のfNIRS信号を利用した映像に対する好みの推定に関する検討 : 複数特徴量の統合と距離計量学習の導入 (ITS)
    豊田 陽, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 173, 177, 2018年02月15日
    電子情報通信学会, 日本語
  • 岩盤の弾性波速度推定に向けたトンネル切羽画像の分類に関する初期検討 (ITS)
    濱野 翔太, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 185, 188, 2018年02月15日
    電子情報通信学会, 日本語
  • 視線データと点検データの正準相関に注目した類似点検データ検索の高精度化に関する検討 (ITS)
    斉藤 僚汰, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 195, 200, 2018年02月15日
    電子情報通信学会, 日本語
  • 楽曲聴取時のユーザに誘起される感情の推定に関する検討 : 深層学習の導入による高精度化 (ITS)
    段 博瀟, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 201, 206, 2018年02月15日
    電子情報通信学会, 日本語
  • SFEM-GSによる特徴統合を利用した映像の評価値推定の高精度化 (ITS)
    伊藤 良起, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 315, 318, 2018年02月15日
    電子情報通信学会, 日本語
  • 機械学習を用いたMR画像からの転移性脳腫瘍の分類に関する一検討 (ITS)
    菅田 健斗, 小川 貴弘, 長谷山 美紀, タ キンキン, 工藤 與亮, 白土 博樹, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 311, 314, 2018年02月15日
    電子情報通信学会, 日本語
  • 胃X線画像を用いた胃炎識別における敵対的生成ネットワークの利用に関する検討 (ITS)
    藤後 廉, 石原 賢太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 299, 303, 2018年02月15日
    電子情報通信学会, 日本語
  • 深層学習を用いた胃X線画像における胃がんリスク検出の高精度化に関する検討 : 複数体位から撮影される画像に対する適用 (ITS)
    石原 賢太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 305, 309, 2018年02月15日
    電子情報通信学会, 日本語
  • 作業員から取得されるセンシングデータを用いた熱中症の予兆検知に向けた検討 : 作業員の体調不良の有無に基づくセンシングデータの傾向分析 (ITS)
    佐坂 勇磨, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 117, 431, 327, 331, 2018年02月15日
    電子情報通信学会, 日本語
  • Preliminary study of automatic gastric cancer risk classification from photofluorography
    Ren Togo, Kenta Ishihara, Katsuhiro Mabe, Harufumi Oizumi, Takahiro Ogawa, Mototsugu Kato, Naoya Sakamoto, Shigemi Nakajima, Masahiro Asaka, Miki Haseyama, World Journal of Gastrointestinal Oncology, 10, 2, 62, 70, 2018年02月15日
    AIM To perform automatic gastric cancer risk classification using photofluorography for realizing effective mass screening as a preliminary study. METHODS We used data for 2100 subjects including X-ray images, pepsinogen ? and ? levels, PG?/PG? ratio, Helicobacter pylori (H. pylori ) antibody, H. pylori eradication history and interview sheets. We performed two-stage classification with our system. In the first stage, H. pylori infection status classification was performed, and H. pylori -infected subjects were automatically detected. In the second stage, we performed atrophic level classification to validate the effectiveness of our system. RESULTS Sensitivity, specificity and Youden index (YI) of H. pylori infection status classification were 0.884, 0.895 and 0.779, respectively, in the first stage. In the second stage, sensitivity, specificity and YI of atrophic level classification for H. pylori -infected subjects were 0.777, 0.824 and 0.601, respectively. CONCLUSION Although further improvements of the system are needed, experimental results indicated the effectiveness of machine learning techniques for estimation of gastric cancer risk., Baishideng Publishing Group Co, 英語
  • 再帰型ニューラルネットワークを用いたサッカー映像における基本戦術の推定に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    鈴木 元樹, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 131, 135, 2018年02月
    映像情報メディア学会, 日本語
  • 深層学習を用いた画像共有サービスに投稿される観光画像のカテゴリ分類の高精度化に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 161, 165, 2018年02月
    映像情報メディア学会, 日本語
  • 背景差分法と深層学習による歩行者検出を用いた河川CCTV映像における歩行者追跡に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    川本 舜, 石原 賢太, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 179, 183, 2018年02月
    映像情報メディア学会, 日本語
  • 岩盤の弾性波速度推定に向けたトンネル切羽画像の分類に関する初期検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    濱野 翔太, 原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 185, 188, 2018年02月
    映像情報メディア学会, 日本語
  • 道路構造物に発生する変状の自動分類の高精度化に向けたConvolutional Sparse Codingの導入に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    前田 圭介, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 189, 194, 2018年02月
    映像情報メディア学会, 日本語
  • 視線データと点検データの正準相関に注目した類似点検データ検索の高精度化に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    斉藤 僚汰, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 195, 200, 2018年02月
    映像情報メディア学会, 日本語
  • 胃X線画像を用いた胃炎識別における敵対的生成ネットワークの利用に関する検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    藤後 廉, 石原 賢太, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 299, 303, 2018年02月
    映像情報メディア学会, 日本語
  • 機械学習を用いたMR画像からの転移性脳腫瘍の分類に関する一検討 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    菅田 健斗, 小川 貴弘, 長谷山 美紀, タ キンキン, 工藤 與亮, 白土 博樹, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 311, 314, 2018年02月
    映像情報メディア学会, 日本語
  • SFEM-GSによる特徴統合を利用した映像の評価値推定の高精度化 (マルチメディアストレージ ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    伊藤 良起, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 42, 4, 315, 318, 2018年02月
    映像情報メディア学会, 日本語
  • 北海道大学における数理・データサイエンス教育の最前線-オーダーメイド型の実践教育プログラムの取組-
    長谷山美紀, 大本亨, 高橋翔, 長谷山美紀, 大本亨, 電子情報通信学会技術研究報告, 117, 431(ITS2017 61-83), 2018年
  • 北海道大学における数理・データサイエンス教育の最前線-一般教育プログラムおよび専門教育プログラムの取組-
    長谷山美紀, 大本亨, 高橋翔, 長谷山美紀, 大本亨, 電子情報通信学会技術研究報告, 117, 431(ITS2017 61-83), 2018年
  • 数理・データサイエンス教育研究の動向-北海道大学数理・データサイエンス教育研究センターの取組-
    長谷山美紀, 大本亨, 高橋翔, 長谷山美紀, 大本亨, 電子情報通信学会技術研究報告, 117, 431(ITS2017 61-83), 2018年
  • フラクタル画像符号化における復号画質とフラクタル存在量の関係に関する考察
    竹沢恵, 真田博文, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 複数の分類器から得られる確信度に注目したサッカー映像における重要シーンの検出に関する検討
    春山知生, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • SemiCCAに基づくfMRIデータを用いた注視画像のカテゴリ推定の高精度化に関する検討
    赤松祐亮, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 複数の識別器から得られる予測値の統合に基づくフォロイー推薦の高精度化に関する検討
    滝村祥司, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • FCNとCNNを用いた地下鉄トンネルにおける変状検出に関する検討
    WANG An, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 視線データを用いた画像注視時の感情推定に関する検討-正準相関分析に基づく画像特徴変換手法の導入-
    松井太我, 斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 深層学習に基づく特徴量を用いたサッカー映像に撮像されたフィールド位置の推定に関する検討
    鈴木元樹, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • テンソル補完に基づいたユーザの動作からの関心度推定に関する検討
    九島哲哉, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 地下鉄トンネルにおける変状評価支援のための類似点検データ検索の初期検討
    弦間奨, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 河川CCTV映像を用いた利用者の行動分類に関する初期検討
    川本舜, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • トンネル切羽画像を用いた岩盤の弾性波速度の推定に関する検討
    山本健太郎, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 画像共有サービスにおける画像の人気度予測に関する検討-回帰問題のための特徴量変換手法の導入-
    豊田陽, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 反復型のMulti-channel Convolutional Sparse Codingを用いた欠損した画素値の推定に関する検討
    松本真直, 斉藤直輝, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2018, 2018年
  • 熟練技術者の判定に基づいた道路橋における類似点検データの検索
    斉藤 僚汰, 高橋 翔, 小川 貴弘, 長谷山 美紀, 土木学会論文集F3(土木情報学), 74, 1, 67, 77, 2018年
    土木学会, 日本語
  • Image Retrieval from Vague Description Based on AttnGAN
    Rintaro Yanagi, Ren Togo, Takahiro Ogawa, Miki Haseyama, 2018 IEEE 7TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE 2018), 198, 199, 2018年
    Image retrieval plays an important role in the information society. Many studies have been conducted to improve accuracy of the image retrieval. However, there exists a major limitation in their input methods. For example, if users only have a vague description that does not include detailed information such as its name and do not have an appropriate input image, it is difficult to retrieve their desired images. To solve this problem, we propose a novel image retrieval method that enables retrieval of a desired image from a vague description. In the proposed method, we generate a query image from a vague description through an Attentional Generative Adversarial Network. By using the generated query image, the proposed method enables users to retrieve images even if they do not have a clear retrieval description as an input. Experimental results show the effectiveness of our method., IEEE, 英語
  • A Language-Independent Ontology Construction Method Using Tagged Images in Folksonomy
    Shota Hamano, Takahiro Ogawa, Miki Haseyama, IEEE Access, 6, 2930, 2942, 2017年12月21日
    This paper presents a language-independent ontology (LION) construction method that uses tagged images in an image folksonomy. Existing multilingual frameworks that construct an ontology deal with concepts translated on the basis of parallel corpora, which are not always available
    however, the proposed method enables LION construction without parallel corpora by using visual features extracted from tagged images as the alternative. In the proposed method, visual similarities in tagged images are leveraged to aggregate synonymous concepts across languages. The aggregated concepts take on intrinsic semantics of themselves, while they also hold distinct characteristics in different languages. Then relationships between concepts are extracted on the basis of visual and textual features. The proposed method constructs a LION whose nodes and edges correspond to the aggregated concepts and relationships between them, respectively. The LION enables successful image retrieval across languages since each of the aggregated concepts can be referred to in different languages. Consequently, the proposed method removes the language barriers by providing an easy way to access a broader range of tagged images for users in the folksonomy, regardless of the language they use., Institute of Electrical and Electronics Engineers Inc., 英語
  • Aesthetic quality assessment of images via Supervised Locality Preserving CCA
    Misaki Kanai, Ren Togo, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    Aesthetic quality assessment plays an important role in how people organize large image collections. Many studies on aesthetic quality assessment are based on design of hand-crafted features without considering whether attributes conveyed by images can actually affect image aesthetics. This paper presents an aesthetic quality assessment method which uses new visual features. The proposed method utilizes Supervised Locality Preserving Canonical Correlation Analysis (SLPCCA) to derive the new features which maximize correlation between attributes and visual features. Finally, by applying ridge regression to the SLPCCA-based features, successful aesthetic quality assessment is realized., Institute of Electrical and Electronics Engineers Inc., 英語
  • Construction of network using heterogeneous social metadata for music video recommendation
    Yui Matsumoto, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    A novel method to construct a network based on heterogeneous features obtained from music videos and social metadata for music video recommendation is presented in this paper. The proposed method enables construction of the network that can accurately associate users with music videos corresponding to their preference by the collaborative use of audio and textual features obtained from music videos and social metadata 'related videos', 'tags', and 'keywords' through sub-sampled canonical correlation analysis. By performing link prediction on the obtained network, our method enables users to obtain desired music videos that are not linked to each other in the network but corresponding to users' preference, that is, music video recommendation becomes feasible. Experimental results for real-world datasets show the effectiveness of our method., Institute of Electrical and Electronics Engineers Inc., 英語
  • Interest level estimation based on matrix completion via rank minimization
    Tetsuya Kushima, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    This paper presents a novel method for interest level estimation based on matrix completion via rank minimization. The proposed method estimates interest levels of target objects from human behavior features which are extracted during selecting these objects. Specifically, by adopting matrix completion via rank minimization, unknown interest levels can be estimated. Furthermore, the proposed method can also estimate unknown interest levels with some missing behavior features which are not correctly extracted by sensors. Experimental results show the effectiveness of the proposed method., Institute of Electrical and Electronics Engineers Inc., 英語
  • Personalized tweet recommendation based on field-aware factorization machines with adaptive field organization
    Shoji Takimura, Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    A novel method for personalized tweet recommendation based on Field-aware Factorization Machines (FFMs) with adaptive field organization is presented in this paper. The proposed method realizes accurate recommendation of tweets in which users are interested by the following two contributions. First, sentiment factors such as opinions, thoughts and feelings included in tweets are newly introduced into FFMs in addition to their publisher and topic factors. Second, the proposed method newly enables adaptive organization of fields via canonical correlation analysis for multiple features extracted from each tweet. Experimental results for real-world datasets confirm the performance improvement of personalized tweet recommendation through the two contributions., Institute of Electrical and Electronics Engineers Inc., 英語
  • Image classification for trend prediction based on integration of fNIRS and visual features
    Kazaha Horii, Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    This paper presents a novel method of image classification for trend prediction based on integration of visual and fNIRS features. It is expected that classification of images in the same object category in terms of generation enables trend prediction. However, since images in the same object category have similar visual features, a limit of accuracy exists for image classification by using only visual features. To overcome this problem, we utilize fNIRS features which represent brain activity in addition to visual features. Specifically, we apply Discriminative Locality Preserving Canonical Correlation Analysis (DLPCCA) to fNIRS and visual features for utilizing them collaboratively. The main contribution of this paper is the improvement of classification performance of images in the same object category for trend prediction by using the visual features projected to the DLPCCA-based space., Institute of Electrical and Electronics Engineers Inc., 英語
  • Video preference estimation using fNIRS signals
    Akira Toyoda, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    This paper presents a new method for video preference estimation using functional near-infrared spectroscopy signals (fNIRS signals). The proposed method first computes fNIRS features from fNIRS signals recorded while users are watching videos and multiple visual features from these videos. Next, by applying Locality Preserving Canonical Correlation Analysis to fNIRS features and each visual feature, we can obtain multiple new visual features. In addition, Multiview Local Fisher Discriminant Analysis fuses multiple new visual features and optimizes within and between class scatter in the fused feature space while using complementary properties in these features. Consequently, we can realize video preference estimation by using the fused features., Institute of Electrical and Electronics Engineers Inc., 英語
  • Preference estimation for video recommendation using DCNN features and viewing behavior
    Yoshiki Ito, Takahiro Ogawa, Miki Haseyama, 2017 IEEE 6th Global Conference on Consumer Electronics, GCCE 2017, 2017-, 1, 2, 2017年12月19日
    This paper presents a personalized preference estimation method for video recommendation. Our method not only uses deep convolutional neural network (DCNN)-based video features but also transforms them based on user's viewing behavior in order to improve accuracy of preference estimation for a video. Specifically, we adopt supervised multi-view canonical correlation analysis (sMVCCA) in order to calculate 'canonical video features', which have a maximal correlation between the following three kinds of features: a video, user's viewing behavior and user's evaluation scores for the video. By using the canonical video features, our method can estimate the user's personalized preference for a video more accurately than using only the DCNN-based video features. Experimental results show the effectiveness of our method., Institute of Electrical and Electronics Engineers Inc., 英語
  • Tracking topic evolution via salient keyword matching with consideration of semantic broadness for Web video discovery
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, Multimedia Tools and Applications, 77, 16, 1, 28, 2017年12月06日
    A method to track topic evolution via salient keyword matching with consideration of semantic broadness for Web video discovery is presented in this paper. The proposed method enables users to understand the evolution of topics over time for discovering Web videos in which they are interested. A framework that enables extraction and tracking of the hierarchical structure, which contains Web video groups with various degrees of semantic broadness, is newly derived as follows: Based on network analysis using multimodal features, i.e., features of video contents and metadata, our method extracts the hierarchical structure and salient keywords that represent contents of each Web video group. Moreover, salient keyword matching, which is newly developed by considering salient keyword distribution, semantic broadness of each Web video group and initial topic relevance, is applied to each hierarchical structure obtained in different time stamps. Unlike methods in previous works, by considering the semantic broadness as well as the salient keyword distribution, our method can overcome the problem of the desired semantic broadness of topics being different depending on each user. Also, the initial topic relevance enables correction of the gap from an initial topic at the start of tracking. Consequently, it becomes feasible to track the evolution of topics over time for finding Web videos in which the users are interested. Experimental results for real-world datasets containing YouTube videos verify the effectiveness of the proposed method., Springer New York LLC, 英語
  • ビッグデータからの価値創出を実現する次世代情報検索―AI・IoT技術の発想支援型検索への導入―
    長谷山美紀, 電子情報通信学会技術研究報告, 117, 329(CS2017 62-77), 101‐106, 106, 2017年11月23日
    電子情報通信学会, 日本語
  • サッカー映像における選手配置に注目した類似場面検出に関する検討 (メディア工学(スポーツ情報処理時限研究会合同開催))
    髙橋 翔, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 41, 41, 5, 8, 2017年11月
    映像情報メディア学会, 日本語
  • 異種特徴の関連性を活用したネットワーク解析に基づく音楽動画コンテンツの推薦に関する一検討―ユーザの好みを反映可能とする特徴変換による高精度化―
    松本有衣, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.112, 2017年10月28日
    日本語
  • 画像特徴量とfNIRS特徴量の関連性に注目した画像分類の高精度化に関する検討
    堀井風葉, 前田圭介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.114, 2017年10月28日
    日本語
  • fNIRS信号を利用した好みの映像識別に関する検討―特徴量選択の導入による高精度化―
    豊田陽, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.76, 2017年10月28日
    日本語
  • フラクタル画像符号化における復号画質と空隙性の関係に関する考察
    竹沢恵, 真田博文, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.77, 2017年10月28日
    日本語
  • 敵対的学習により生成された画像が与える審美的印象に関する検討
    金井美岬, 藤後廉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.115, 2017年10月28日
    日本語
  • 背景差分法と深層学習を用いた河川CCTV映像における歩行者検出の高精度化に関する検討
    川本舜, 石原賢太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.75, 2017年10月28日
    日本語
  • 適応的フィールド構成を導入したFFMに基づくツイート推薦の高精度化に関する検討
    滝村祥司, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.111, 2017年10月28日
    日本語
  • 音響特徴と心拍特徴を用いた楽曲聴取時のユーザに誘起される感情の推定の高精度化に関する検討
    DUAN Boxiao, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.74, 2017年10月28日
    日本語
  • ランク最小化に基づく行列補完を用いた関心度推定の高精度化に関する検討
    九島哲哉, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2017, ROMBUNNO.113, 2017年10月28日
    日本語
  • 正準相関最大化を導入した深層学習に基づく送電鉄塔の劣化レベル分類に関する検討 (メディア工学) -- (サマーセミナー2017 : 世界に羽ばたくビジョン技術)
    前田 圭介, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 41, 29, 11, 14, 2017年09月
    映像情報メディア学会, 日本語
  • Deep Extreme Learning Machineに基づくサッカー映像に撮像されたフィールド位置の推定に関する検討 (メディア工学) -- (サマーセミナー2017 : 世界に羽ばたくビジョン技術)
    鈴木 元樹, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 41, 29, 25, 28, 2017年09月
    映像情報メディア学会, 日本語
  • 変状評価支援のための類似点検データ検索の高精度化に関する検討 : 熟練技術者の判定に関する推定に基づいた学習データ生成法の導入 (メディア工学) -- (サマーセミナー2017 : 世界に羽ばたくビジョン技術)
    斉藤 僚汰, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 41, 29, 49, 52, 2017年09月
    映像情報メディア学会, 日本語
  • 複数の条件で撮像された走査型電子顕微鏡画像を用いたゴム材料の物性値推定に関する検討 (メディア工学) -- (サマーセミナー2017 : 世界に羽ばたくビジョン技術)
    斉藤 直輝, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 41, 29, 31, 34, 2017年09月
    映像情報メディア学会, 日本語
  • Distress Classification of Road Structures via Adaptive Bayesian Network Model Selection
    K. Maeda, S. Takahashi, T. Ogawa, M. Haseyama, JOURNAL OF COMPUTING IN CIVIL ENGINEERING, 31, 5, 2017年09月
    This paper presents an accurate distress classification method via adaptive Bayesian network model selection for maintenance inspection of road structures. The main contribution of this paper is adaptive selection of two Bayesian network models concerning classification performance. The proposed method trains a tag-based Bayesian network model based on inspection items and estimates its classification performance. Furthermore, for distresses that degrade the classification performance of the tag-based Bayesian network model, the proposed method trains another multifeature Bayesian network model based on inspection items and distress images. Consequently, the proposed method can adaptively select optimal Bayesian network models according to the estimated performance of the tag-based Bayesian network model. In actual maintenance inspection, distresses are generally classified either from inspection items alone or from both inspection items and visual information of distress images-i.e., distress classification has two patterns. Therefore the adaptive model selection approach is suitable for this classification scheme. Experimental results show that the proposed method outperforms several comparative methods and is suitable for actual maintenance inspection due to its low computation costs. (C) 2017 American Society of Civil Engineers., ASCE-AMER SOC CIVIL ENGINEERS, 英語
  • Estimation of Regions Related to Helicobacter Pylori Infection from Gastric X-ray Images               
    Ren Togo, Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, 7, 8, 2017年07月
    英語, 研究発表ペーパー・要旨(国際会議)
  • Tracking hierarchical structure of web video groups based on salient keyword matching including semantic broadness estimation
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, 2016 IEEE Global Conference on Signal and Information Processing, GlobalSIP 2016 - Proceedings, 1238, 1242, 2017年04月19日
    This paper presents a novel method to track the hierarchical structure of Web video groups on the basis of salient keyword matching including semantic broadness estimation. To the best of our knowledge, this paper is the first work to perform extraction and tracking of the hierarchical structure simultaneously. Specifically, the proposed method first extracts the hierarchical structure of Web video groups and salient keywords of them on the basis of an improved scheme of our previously reported method. Moreover, to calculate similarities between Web video groups obtained in different time stamps, salient keyword matching is newly developed by considering both co-occurrences of the salient keywords and semantic broadness of each Web video group. Consequently, tracking of the hierarchical structure over time becomes feasible to easily understand popularity trends of many Web videos for realizing effective retrieval., Institute of Electrical and Electronics Engineers Inc., 英語
  • グラフ構造解析を用いたユーザと楽曲の関連性の定量化に関する検討(2)リンク予測を用いた推薦精度の検証 (ITS)
    木下 奨平, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 31, 34, 2017年02月20日
    電子情報通信学会, 日本語
  • 送電鉄塔劣化診断のための見本画像の選択に関する検討 (ITS)
    藤後 廉, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 47, 50, 2017年02月20日
    電子情報通信学会, 日本語
  • 深層学習を用いた道路構造物の維持管理における変状分類の高精度化に関する検討 (ITS)
    前田 圭介, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 51, 54, 2017年02月20日
    電子情報通信学会, 日本語
  • 電子顕微鏡画像および配合量を用いたゴム材料の物性値推定に関する検討 (ITS)
    斉藤 直輝, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 41, 45, 2017年02月20日
    電子情報通信学会, 日本語
  • 送電鉄塔の点検時に撮影される鉄塔映像からの被写体領域抽出に関する検討 (ITS)
    館農 浩平, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 25, 30, 2017年02月20日
    電子情報通信学会, 日本語
  • 顔器官の動きを用いた映像に対する関心の度合いの推定に関する検討 : 異常検知の枠組みの導入 (ITS)
    佐坂 勇磨, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 77, 80, 2017年02月20日
    電子情報通信学会, 日本語
  • Web映像集合の階層構造を用いた検索法に関する検討 : 可視化インタフェースを通した有効性評価 (ITS)
    竹原 大智, 原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 63, 66, 2017年02月20日
    電子情報通信学会, 日本語
  • 畳み込みニューラルネットワークを用いた地下鉄トンネルにおける変状検出に関する検討 (ITS)
    石原 賢太, 高橋 翔, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 81, 86, 2017年02月20日
    電子情報通信学会, 日本語
  • 音響特徴量およびfMRI特徴量の協調利用による目的音検出に関する検討 (ITS)
    田中 佑磨, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 59, 62, 2017年02月20日
    電子情報通信学会, 日本語
  • タグ付き画像を用いたコンセプト間の関係抽出の高精度化に関する検討 (ITS)
    濱野 翔太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 67, 70, 2017年02月20日
    電子情報通信学会, 日本語
  • 画像注視時のfNIRS信号を利用した個人の感情推定に関する検討 (ITS)
    菅田 健斗, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 87, 90, 2017年02月20日
    電子情報通信学会, 日本語
  • 楽曲聴取時のユーザに誘起される感情の推定に関する検討 : 複数の推定結果の統合による高精度化 (ITS)
    段 博瀟, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 463, 349, 353, 2017年02月20日
    電子情報通信学会, 日本語
  • 送電鉄塔劣化診断のための見本画像の選択に関する検討 (マルチメディアストレージ コンシューマエレクトロニクス ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    藤後 廉, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 41, 5, 47, 50, 2017年02月
    映像情報メディア学会, 日本語
  • A method of important player extraction based on link analysis in soccer videos
    Sho Takahashi, Miki Haseyama, ITE Transactions on Media Technology and Applications, 5, 2, 42, 48, 2017年
    In this paper, a method for extraction of important players in soccer videos based on link analysis is proposed. In a soccer match, players perform shoot tackles, assistance, and covering. Furthermore, the soccer tactics are defined the formation of players based on various relationships between players. The proposed method extracts the important players, in order to obtain information for understanding the soccer matches for various audiences. Specifically, our method notes that relationship between players, who cooperate with each other by the pass and the covering, is similar to relationship between web pages which are connected by links. First, the proposed method obtains player networks based on relationship between players in each team. The relationships are defined based on player positions and the possibility of the pass or the covering between players. Finally, in the proposed method, by applying the link analysis to the obtained player networks, important players are extracted. By realizing this approach, important players are extracted from the player networks based on the possibility of the pass or the covering between players. In the last of this paper, the above link analysis-based method was applied to actual soccer matches to show the reasonability of our method., Institute of Image Information and Television Engineers, 英語
  • バイオミメティクス画像検索エンジン―発想支援型画像検索の応用―
    長谷山美紀, 可視化情報学会誌, 37, 144, 24‐29,1(4), 29,図巻頭1p, 2017年01月01日
    可視化情報学会, 日本語
  • 特定集中治療室用の重症度推定に関する一考察~疾病による推定精度の違い~
    畠山泰貴, 小川貴弘, 田中宏和, 長谷山美紀, 情報理論とその応用シンポジウム予稿集(CD-ROM), 39th, ROMBUNNO.9.3.2, 2016年12月06日
    日本語
  • パス可能領域に注目したサッカー映像における類似場面の検出に関する検討
    高橋翔, 長谷山美紀, 映像情報メディア学会技術報告, 40, 43(ME2016 125-132), 9‐12, 12, 2016年11月28日
    本稿では,サッカー映像に推定するパス可能領域に注目して類似場面を検出する手法について検討する.サッカーにおいてパスは,最も基本的かつ重要な戦術の1つであり,その分析は試合内容の理解に有用である.一般にパスは,同様の攻撃方法をとる場合に,そのコースが類似すると考えられる.そこで,本稿では,サッカー映像に推定するパス可能領域を特徴量の1つとして用いることで,データベースに記録されている過去の試合映像から類似した場面の検出を試みる., 一般社団法人 映像情報メディア学会, 日本語
  • 画像注視時における脳機能画像のテンソル解析に基づく感情推定に関する検討
    菅田健斗, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.109, 2016年11月05日
    日本語
  • 深層学習によって得られる画像特徴量を用いた道路構造物の点検データ検索の高精度化に関する検討
    斉藤僚汰, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.114, 2016年11月05日
    日本語
  • Signedネットワーク解析に基づくWeb映像集合の階層構造抽出に関する一検討
    原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.103, 2016年11月05日
    日本語
  • 音響特徴と心拍特徴を用いた感情推定に基づく楽曲分類に関する検討―Decision‐Level Fusionによる高精度化―
    DUAN Boxiao, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.101, 2016年11月05日
    日本語
  • 画像注視時のユーザの脳波信号を利用した好みの画像の識別に関する検討
    豊田陽, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.108, 2016年11月05日
    日本語
  • 深層学習を用いた胃X線画像におけるHelicobacter pylori感染識別に関する初期検討
    石原賢太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.115, 2016年11月05日
    日本語
  • タグ付き画像を用いたオントロジー構築におけるコンセプト間の包摂関係の定量化に関する検討
    濱野翔太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.102, 2016年11月05日
    日本語
  • 昆虫の同定を目的とした類似画像検索の高精度化に関する検討
    弦間奨, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.100, 2016年11月05日
    日本語
  • ユーザの視聴動作を用いた映像の評価値推定の高精度化に関する検討
    伊藤良起, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2016, ROMBUNNO.107, 2016年11月05日
    日本語
  • IoTヘルスケア時代の仮想生体情報センサ′′MIRUWS′′
    南重信, 長谷山美紀, 田中宏和, 高橋透, 小森達也, 電子情報通信学会大会講演論文集(CD-ROM), 2016, ROMBUNNO.BS‐6‐2, 2016年09月06日
    日本語
  • Web映像検索を目的としたリランキングの高精度化に関する検討
    吉田壮, 小川貴弘, 長谷山美紀, 棟安実治, 電子情報通信学会大会講演論文集(CD-ROM), 2016, ROMBUNNO.A‐15‐5, 2016年09月06日
    日本語
  • 発想支援型検索と異分野連携がもたらす可能性
    長谷山美紀, 化学経済, 63, 11, 42‐46, 2016年09月01日
    日本語
  • 画像共有サービスに投稿される画像の観光名所に関するカテゴリー分類
    斉藤 直輝, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会論文誌 D, 99, 9, 848, 860, 2016年09月01日
    本論文では,画像共有サービスに投稿される画像の観光名所に関するカテゴリー(観光カテゴリー)の分類手法を提案する.提案手法では,画像共有サービスにおいて画像とともに投稿される様々なデータの中で,位置座標が観光カテゴリーの分類に最も効果的であることに注目する.更に,このデータに基づいた分類において誤りが発生する場合を,分類結果から導出される確信度に基づいて判定する.誤分類と判定された場合,提案手法では,画像及びタグの特徴に基づいた分類結果を求め,それらを各々の分類精度に注目して統合することで,最終的な分類結果を高精度に推定可能とする.このとき,位置座標による分類結果に基づいて分類候補の観光カテゴリーを限定することで,多クラス分類問題におけるクラス数を減少させ,より正確な分類を可能とする.以上の提案手法によって,異なる種類のデータの分類精度が互いに大きく異なる場合に従来手法では困難であった高精度な最終分類結果の取得が可能となる., IEICE, the Institute of Electronics, Information and Communication Engineers, 日本語
  • マダラシミ鱗粉の摩擦特性
    平井悠司, 奥田直人, 斉藤直樹, 小川貴弘, 町田龍一郎, 野村周平, 大原昌宏, 長谷山美紀, 下村政嗣, 高分子学会予稿集(CD-ROM), 65, 2, ROMBUNNO.2U01, 2016年08月24日
    日本語
  • 音響聴取時の脳活動信号を用いた目的音検出に関する検討
    田中佑磨, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 40, 28(ME2016 88-115), 81‐82, 2016年08月24日
    日本語
  • 生物の走査型電子顕微鏡像の撮像部位の分類における特徴選択方法に関する検討
    斉藤直輝, 小川貴弘, 平井悠司, 長谷山美紀, 映像情報メディア学会技術報告, 40, 28(ME2016 88-115), 19‐20, 2016年08月24日
    日本語
  • 材料開発のための新しい情報科学―バイオミメティクス画像検索基盤の実装―
    長谷山美紀, 高分子学会予稿集(CD-ROM), 65, 2, ROMBUNNO.1U12, 2016年08月24日
    日本語
  • 個人の画像注視時の脳機能画像を利用した感情推定に関する検討―複数のブロードマン領野から得られる推定結果の統合による高精度化―
    菅田健斗, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 40, 28(ME2016 88-115), 71‐72, 2016年08月24日
    日本語
  • 火星に発生するdust stormの自動検出に関する検討―不均衡データを考慮した識別器の構築―
    前田圭介, 小川貴弘, 長谷山美紀, 映像情報メディア学会技術報告, 40, 28(ME2016 88-115), 47‐48, 2016年08月24日
    日本語
  • 高速道路の維持管理における点検記録データ検索に対する技術者の評価を用いた検索精度向上に関する検討
    高橋翔, 小川貴弘, 長谷山美紀, 映像情報メディア学会年次大会講演予稿集(CD-ROM), 2016, ROMBUNNO.22B‐1, 2016年08月17日
    日本語
  • マルチメディア信号処理と次世代情報検索
    長谷山美紀, 電子情報通信学会技術研究報告, 116, 167(HIP2016 31-41), 33‐36, 2016年07月22日
    日本語
  • 胃X線画像におけるHelicobacter pylori感染識別に関する検討(3)医療施設における撮像環境と識別精度間の関連性に関する一考察 (バイオメトリクス)
    石原 賢太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 116, 107, 57, 62, 2016年06月20日
    電子情報通信学会, 日本語
  • 胃X線画像におけるHelicobacter pylori感染識別に関する検討(3)医療施設における撮像環境と識別精度間の関連性に関する一考察 (情報センシング メディア工学)
    石原 賢太, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 40, 18, 57, 62, 2016年06月13日
    映像情報メディア学会, 日本語
  • 生物から学ぶトライボロジー 生物表面の摩擦―自己組織化によるバイオミメティクス―
    下村政嗣, 平井悠司, 奥田直人, 町田龍一郎, 町田龍一郎, 野村周平, 大原昌宏, 長谷山美紀, トライボロジスト, 61, 4, 215‐221, 2016年04月15日
    日本語
  • ボディエリアネットワークと今後の技術課題―ETSI SmartBAN標準化最新動向から―
    田中宏和, 南重信, 長谷山美紀, 新實朋子, 高橋透, 電子情報通信学会大会講演論文集(CD-ROM), 2016, 1, ROMBUNNO.B‐20‐12, 659, 2016年03月01日
    一般社団法人電子情報通信学会, 日本語
  • パワースペクトルに注目した音響信号のスパース表現の定量評価 (ITS)
    田中 佑磨, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 115, 458, 217, 220, 2016年02月22日
    電子情報通信学会, 日本語
  • グラフ構造解析を用いたユーザと楽曲の関連性の定量化に関する検討
    木下奨平, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 209‐212, 2016年02月15日
    日本語
  • 胃X線画像を用いたHelicobacter Pylori感染の高精度識別に関する検討(3)―識別精度低下の原因となる領域の推定―
    藤後廉, 石原賢太, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 333‐336, 2016年02月15日
    日本語
  • 道路構造物の維持管理における高精度な変状分類に関する検討―タグデータと撮影画像に基づく識別結果の統合―
    前田圭介, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 181‐184, 2016年02月15日
    日本語
  • 異なるソーシャルメディアのコンテンツを用いた階層的トピック検出に関する検討
    竹原大智, 原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 193‐196, 2016年02月15日
    日本語
  • Web上に存在する画像データの可視化のための次元削減に関する検討
    館農浩平, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 337‐340, 2016年02月15日
    日本語
  • 生物の走査型電子顕微鏡像の撮像部位の分類に関する検討―カーネル法の導入による複数の分類結果統合の高精度化―
    斉藤直輝, 小川貴弘, 平井悠司, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 51‐54, 2016年02月15日
    日本語
  • Web映像集合の階層構造の時系列変化検出に関する一検討
    原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 201‐204, 2016年02月15日
    日本語
  • 高速道路の維持管理における変状の評価業務を支援するためのデータ分析―変状の画像を用いた類似点検記録の検索法の実現―
    三改木裕矢, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 169‐172, 2016年02月15日
    日本語
  • 堤防点検における技術者の視線データと熟練度の分析に関する一考察
    高橋翔, 三改木裕矢, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 177‐180, 2016年02月15日
    日本語
  • グラフ構造に基づくリランキングを利用したWeb映像検索の高精度化に関する検討
    吉田壮, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 197‐200, 2016年02月15日
    日本語
  • 河川管理業務の堤防点検における技術者の視線データ取得の試み
    三改木裕矢, 高橋翔, 小川貴弘, 秋山泰祐, 巖倉啓子, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 173‐176, 2016年02月15日
    日本語
  • 胃X線画像におけるHelicobacter pylori感染識別に関する検討(2)~血液検査におけるHp抗体値およびPG値を用いた識別に有効な画像特徴量の導入~
    石原賢太, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 329‐332, 2016年02月15日
    日本語
  • ヒトの楽曲聴取時の脳機能画像における賦活部位の抽出に関する検討
    澤田充奨, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 115, 458(ITS2015 56-83), 213‐216, 2016年02月15日
    日本語
  • 河川管理業務の堤防点検における技術者の視線データ取得の試み (マルチメディアストレージ コンシューマエレクトロニクス ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    三改木 裕矢, 高橋 翔, 小川 貴弘, 秋山 泰祐, 巖倉 啓子, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 40, 6, 173, 176, 2016年02月
    映像情報メディア学会, 日本語
  • 堤防点検における技術者の視線データと熟練度の分析に関する一考察 (マルチメディアストレージ コンシューマエレクトロニクス ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    高橋 翔, 三改木 裕矢, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 40, 6, 177, 180, 2016年02月
    映像情報メディア学会, 日本語
  • Web映像集合の階層構造の時系列変化検出に関する一検討 (マルチメディアストレージ コンシューマエレクトロニクス ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 40, 6, 201, 204, 2016年02月
    映像情報メディア学会, 日本語
  • A Touism Category Classification Method Based on Estimation of Reliable Decision
    Naoki Saito, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama, 2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS, 1, 2, 2016年
    In this paper, we propose a tourism category classification method based on estimation of reliable decision. The proposed method performs tourism category classification using location, visual, and textual tag features obtained from tourism images in image sharing services. As the biggest contribution of this paper, the proposed method performs successful classification based on two classification results obtained from a fuzzy K-nearest neighbor algorithm using the location features and a decision level fusion approach using the visual and textual tag features. The proposed method enables estimation of reliable decision from above two classifiers., IEEE, 英語
  • Different Language Association Using Mutual Information Between Tags and Visual Features
    Shota Hamano, Takahiro Ogawa, Mild Haseyama, 2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS, 1, 2, 2016年
    This paper presents a method for associating tags in one language with the tags representing the same meaning in another language. Since recent image search and sharing services highly rely on annotations like tags with images for obtaining the desired images, the proposed method utilizes the visual features extracted from images with tags. In the proposed method, mutual information between tags and visual features are calculated. Tag similarity is then calculated based on the mutual information. Mutual information takes into consideration the relevance between tags and visual features. Therefore, the similarity based on the mutual information represents tag-to-tag relationships more effectively than direct use of the visual features. Experimental results show the effectiveness of the proposed method in associating English tags with Japanese tags representing the same meanings., IEEE, 英語
  • Novel Video Feature-based Favorite Video Estimation Using Users' Viewing Behavior and Evaluation
    Yoshiki Ito, Takahiro Ogawa, Miki Haseyama, 2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS, 1, 2, 2016年
    This paper presents novel video feature-based favorite video estimation method. In the proposed method, we use three features, videos, users' viewing behavior and users' evaluation scores for these videos. In order to calculate the novel video features, Multiset Canonical Correlations Analysis (MCCA) is applied to these features to integrate the different types of features. Specifically, MCCA maximizes the sum of three kinds of correlations between three pairs of these features. Then the novel video features that represent the users' individual preference can be obtained by using the projection maximizing the three correlations. Finally, Supported Vector Ordinal Regression (SVOR) is trained by using the novel video features to estimate favorite videos. Experimental results show the effectiveness of our method., IEEE, 英語
  • Image Retrieval for Identification of Insects Based on Saliency Map and Distance Metric Learning
    Susumu Genma, Takahiro Ogawa, Miki Haseyama, 2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS, 1, 2, 2016年
    This paper presents an image retrieval method for insect identification based on saliency map and distance metric learning. First, the proposed method extracts regions of insects from target images by using saliency map and calculates visual features from the extracted insect regions. Next, in order to realize accurate retrieval of insects based on the calculated features, distance metric learning is newly adopted. Consequently, through users' evaluation in the retrieval, optimal distance can be obtained for the calculated visual features to obtain successful retrieval results, and the identification of insects becomes feasible. Experimental results show the effectiveness of our method., IEEE, 英語
  • Estimating Human Emotion Evoked by Visual Stimuli Using fMRI Data
    Kento Sugata, Takahiro Ogawa, Miki Haseyama, 2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS, 1, 2, 2016年
    This paper presents a method that estimates human emotion evoked by visual stimuli using functional magnetic resonance imaging (fMRI) data. First, in our method, preprocessing and masking procedures are applied to the fMRI data. These procedures provide the multiple brain data corresponding to Brodmann areas (BA). In most cases, the dimensionality of fMRI data and the BA data is larger than the number of observations, and this results in overfilling. Thus, in order to reduce the dimensionality, we apply general tensor discriminant analysis (GTDA), which can take into account the information related to the users' emotion. Then multiple estimation results of the users' emotion are obtained from support vector machine by separately using the multiple BA data obtained after the dimensionality reduction via GTDA. Furthermore, our method obtains the final estimation result from effective supervised decision-level fusion of the above estimation results., IEEE, 英語
  • Decision Level Fusion-based Team Tactics Estimation in Soccer Videos
    Genki Suzuki, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, 2016 IEEE 5TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS, 1, 2, 2016年
    A decision-level fusion (DLF)-based team tactics estimation method in soccer videos is newly presented. In our method, tactics estimation based on audio-visual and formation features is newly adopted since the tactics of the soccer game are closely related to the audio-visual sequences and player positions. Therefore, by using these features, we classify the tactics via Support. Vector Machine (SVM). Furthermore, by applying DIA' to the SVM-based classification results, the two modalities are integrated to obtain more accurate tactics estimation results. Some results of experiments verify the superiority of our method., IEEE, 英語
  • An Accurate Mortality Prediction Method Based on Decision-level Fusion of Existing ICU Scoring Systems
    Yasutaka Hatakeyama, Takahiro Ogawa, Hirokazu Tanaka, Miki Haseyama, PROCEEDINGS OF 2016 INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY AND ITS APPLICATIONS (ISITA 2016), 126, 130, 2016年
    In this paper, we propose a mortality prediction method based on decision-level fusion (DLF) of existing intensive unit care (ICU) scoring systems. First, the proposed method obtains severity scores from the existing ICU scoring systems. Furthermore, we construct classifiers that categorize patients into survivors or non-survivors. Next, patient feature vectors are extracted based on the mortality rates that are estimated from the obtained severity scores by using a non-linear least squares method to obtain other types of classification results. In order to obtain the final severity score for each patient, we integrate the obtained multiple classification results based on DLF that can estimate the final severity scores. Finally, we performed the proposed method to actual ICU patient data and verified the effectiveness of the proposed method. Thus, the proposed method can realize accurate mortality prediction without any additional work by using the existing ICU scoring systems., IEEE, 英語
  • DLF-based speech segment detection and its application to audio noise removal for video conferences
    Kazuto Sasaki, Takahiro Ogawa, Sho Takahashi, Miki Haseyama, ITE Transactions on Media Technology and Applications, 4, 1, 68, 77, 2016年
    A new decision-level fusion (DLF)-based speech segment detection method and its application to audio noise removal for video conferences are presented in this paper. The proposed method calculates visual and audio features from video sequences and audio signals, respectively, obtained in video conferences. Features extracted from mouth regions of participants and attribution degrees of speech class are used as visual and audio features, respectively, and Support Vector Machine (SVM)-based classification is performed by using each kind of feature. The SVM classifier performs two-class classification of speech and non-speech segments to realize speech segment detection. From the detection results obtained from the visual and audio features, DLF based on Supervised Learning from Multiple Experts is performed to successfully obtain the final detection results with focus on the accuracy of each detection result. Then, from audio signals in the non-speech segments detected by our method, we can extract noise information to realize accurate audio noise removal in the speech segments., Institute of Image Information and Television Engineers, 英語
  • Accurate and efficient extraction of hierarchical structure ofweb communities for web video retrieval
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, ITE Transactions on Media Technology and Applications, 4, 1, 49, 59, 2016年
    This paper presents an accurate and efficient method for extracting hierarchical structure of Web communities, i.e., Web video sets with similar topics for Web video retrieval. First, efficient canonical correlation analysis (CCA), named sub-sampled CCA, is derived to obtain link relationships that represent similarities between latent features of Web videos. Moreover, the obtained link relationships enable application of an algorithm based on recursive modularity optimization to extract hierarchical structure of Web communities. Different from previously reported methods, our method can extract the hierarchical structure for the whole target dataset since the algorithm enables recursive reduction of its processing targets. This means it becomes unnecessary to perform screening of Web videos, and we can avoid performance degradation caused by discarding relevant Web videos in the screening, which occurred in previously reported methods. Consequently, our method enables extraction of the hierarchical structure with high accuracy as well as low computational cost., Institute of Image Information and Television Engineers, 英語
  • Classification of gastric cancer risk from X-ray images based on efficient image features related to serum Hp antibody level and serum PG levels
    Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, ITE Transactions on Media Technology and Applications, 4, 4, 337, 348, 2016年
    In this paper, a fully automatic gastric cancer risk classification method with the aim of constructing a computer-aided diagnosis (CAD) system is presented. Two-stage classification is used in the proposed method for determining gastric cancer risk. In the first stage, the proposed method detects H. pylori-infected patients, i.e., detection of patients who have gastric cancer risk, and the proposed method classifies the level of gastric cancer risk, i.e., high or low, from H. pylori-infected patients in the second stage. In each stage, we derive new image features that are closely related to values of blood examination via kernel canonical correlation analysis. The introduction of these new image features provides classification improvement in each stage, and it is the main contribution of this paper. Consequently, accurate classification becomes feasible by the proposed method. Experimental results obtained by applying the proposed method to real X-ray images show that our method outperforms several comparative methods., Institute of Image Information and Television Engineers, 英語
  • Biological surface friction - Biomimetic approach based on self-organization
    Masatsugu Shimomura, Yuji Hirai, Naoto Okuda, Ryuichiro Machida, Syûhei Nomura, Masahiro Ôhara, Miki Haseyama, Toraibarojisuto/Journal of Japanese Society of Tribologists, 61, 215, 221, 2016年01月01日
  • Web映像検索のためのグラフマイニングを用いたリランキング手法
    吉田壮, 小川貴弘, 長谷山美紀, 棟安実治, 信号処理シンポジウム講演論文集(CD-ROM), 31st, ROMBUNNO.A6‐5, 2016年
    日本語
  • 深層学習を用いた胃X線画像におけるHelicobacter pylori感染識別手法の高精度化に関する検討
    石原賢太, 小川貴弘, 長谷山美紀, 信号処理シンポジウム講演論文集(CD-ROM), 31st, ROMBUNNO.B4‐1, 2016年
    日本語
  • 胃X線画像を用いたHelicobacter Pylori感染の高精度識別に関する検討(4)
    藤後廉, 石原賢太, 小川貴弘, 長谷山美紀, 信号処理シンポジウム講演論文集(CD-ROM), 31st, ROMBUNNO.B4‐2, 2016年
    日本語
  • アクティブネットを用いたサッカー映像におけるパス可能領域推定の並列計算による高速化に関する検討
    高橋翔, 長谷山美紀, 映像情報メディア学会技術報告, 39, 49(ME2015 118-124), 1‐6, 6, 2015年12月03日
    本稿では,サッカー映像におけるパス可能領域推定を並列計算可能とすることで高速化する手法について検討する.サッカーにおいてパスは試合内容の分析に有用であることから,パス可能な領域を明らかとすることは重要である.このため,我々は,以前にアクティブネットを用いてパス可能領域の推定手法を提案した.しかしながら,この手法の問題の一つに計算時間が挙げられる.そこで,本稿では,並列計算によってパス可能領域のより高速な推定を試みる.本稿では,並列計算の環境としてCUDA^を採用し,NVIDIA社GeForceGTX660を用いて実験を行った.その結果,CPU (Intel^[○!R] Core^ i7-3930K 3.20GHz)と比べて高速に計算することが可能となることを確認した., 一般社団法人 映像情報メディア学会, 日本語
  • サッカー映像におけるグループ戦術解析のための優勢度推定に関する一考察
    高橋翔, 長谷山美紀, 映像情報メディア学会技術報告, 39, 49(ME2015 118-124), 7‐12, 12, 2015年12月03日
    本稿では,サッカー映像において,戦術上関連がある選手のグループを解析し,各グループに推定する優勢度(以降,グループ優勢度)と試合内容との関連について検討する.グループ優勢度は,選手位置の関係から求める戦術上関連がある選手のグループ,および戦術上の関係に基づいて各グループにおいてチームそれぞれが優勢である度合いとして推定する.サッカーにおいて各選手の戦術上の役割や状況は,選手位置の関係から求めることが可能であり,本手法では,これらをグループ内で評価することでどちらのチームが戦術上優位な状況にいる選手が多いのかの推定を実現する.本稿の最後には,実際のサッカー映像に推定する優勢度と試合内容との関連について検討する., 一般社団法人 映像情報メディア学会, 日本語
  • 画像共有サービスにおける投稿画像の分類結果の信頼度推定に関する検討
    斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.128, 2015年11月07日
    日本語
  • 道路構造物の変状画像に対する類似検索の高精度化に関する検討
    高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.134, 2015年11月07日
    日本語
  • Web映像検索のためWebコミュニティの提示法に関する検討―Webコミュニティに含まれるトピックを考慮した代表キーフレーズ抽出の試み―
    竹原大智, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.122, 2015年11月07日
    日本語
  • 個々の道路構造物に関する点検項目の導入による道路構造物の変状推定の高精度化に関する検討
    前田圭介, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.133, 2015年11月07日
    日本語
  • 胃X線画像を用いたHelicobacter pylori感染の高精度識別に関する検討(2)―撮像方向が識別に有効な画像領域に与える影響に対する考察―
    藤後廉, 石原賢太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.123, 2015年11月07日
    日本語
  • 楽曲中の歌唱区間推定における簡易脳波計の導入に関する検討
    菅田健斗, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.121, 2015年11月07日
    日本語
  • サッカー映像における試合内容の理解を促すデータの提示に関する検討
    高橋翔, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.135, 2015年11月07日
    日本語
  • 顔器官の動きに基づく関心の有無の推定に関する検討
    佐坂勇磨, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015, ROMBUNNO.120, 2015年11月07日
    日本語
  • 未来の検索技術を目指して(選奨受賞者からのメッセージ,特別寄稿)
    長谷山 美紀, 映像情報メディア学会誌 : 映像情報メディア, 69, 7, 642, 642, 2015年09月01日
    一般社団法人映像情報メディア学会, 日本語
  • 情報科学が繋ぐ生物とものづくり―バイオミメティクス・画像検索システムの理論と実現―
    長谷山美紀, 高分子学会予稿集(CD-ROM), 64, 1, ROMBUNNO.3B15IL, 2015年05月12日
    日本語
  • 分類体系に注目した決定木の構築に基づく走査型電子顕微鏡画像を 用いた生物の分類法
    朴 君, 小川 貴弘, 長谷山 美紀, 電子情報通信学会論文誌 D, 情報・システム, 98, 5, 823, 834, 2015年05月01日
    本論文では,走査型電子顕微鏡(Scanning Electron Microscop,SEM)で撮像された画像を用いた生物の分類法を提案する.提案手法では,生物学者が構築した分類体系に注目し,各ノードにその下位のノードへの分類を行う分類器を割り当てることで,決定木を構築する.これにより,構築された決定木を用いて生物の分類が可能となる.このように,生物の分類に有用な分類体系の構造を導入することで,画像特徴のみに注目する生物の分類法と比較して,高精度な分類が期待できる.また,提案手法では,更なる精度向上のため,以下の二つの処理も導入する.まず,分類体系において,画像特徴が類似する異なるノードに注目した決定木の変更を行い,誤分類を抑制する.次に,同種の生物の異なる撮像倍率の画像に対し,モーフィングを施すことで学習データの充足を行う.以上によって,提案手法では,SEMで撮像された生物の高精度な分類が可能となる.本論文の最後では,提案手法の有効性を確認するための実験結果を示す., 電子情報通信学会, 日本語
  • 顕微鏡による生物の撮像方法に着目した超解像に関する検討 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス マルチメディアストレージ コンシューマエレクトロニクス)
    廣川 真梨子, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 39, 7, 167, 172, 2015年02月16日
    映像情報メディア学会, 日本語
  • 画像注視時の脳波特徴量を用いた画像分類に関する検討(4)―複数のユーザの脳波を用いた分類精度の検証―
    川上拓也, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 185, 190, 2015年02月16日
    日本語
  • 楽曲聴取時の個人の脳波信号を利用した好みの楽曲の識別に関する検討―クラス情報を考慮した正準相関分析による高精度化―
    澤田充奨, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 179, 184, 2015年02月16日
    日本語
  • 映像特徴とタグ情報を考慮したネットワーク構造解析に基づくWeb映像検索に関する検討―ネットワークの局所的構造を考慮した正則化項の導入による高精度化―
    吉田壮, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 77, 82, 2015年02月16日
    日本語
  • 社会インフラの維持管理業務効率化のための点検データ分析に関する検討―撮影画像と点検結果に基づく点検データ間の関連性の定量化―
    三改木裕矢, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 257, 262, 2015年02月16日
    日本語
  • Superpixel算出手法の導入による光源および分光反射率推定の高精度化に関する検討
    五十嵐祐太, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 247, 252, 2015年02月16日
    日本語
  • 画像共有サイトの投稿画像の高精度な分類に関する検討
    斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 71, 75, 2015年02月16日
    電子情報通信学会, 日本語
  • Web映像検索のためのWebコミュニティの階層構造提示法に関する一検討―Webコミュニティを代表するキーワード抽出の試み―
    原川良介, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 89, 94, 2015年02月16日
    日本語
  • 走査型電子顕微鏡画像を用いた生物の分類の高精度化―顕微鏡画像の取得方法に注目した学習データ選択法の導入―
    PIAO Jun, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 173, 178, 2015年02月16日
    日本語
  • 顕微鏡による生物の撮像方法に着目した超解像に関する検討
    廣川真梨子, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 167, 172, 2015年02月16日
    日本語
  • 胃X線画像におけるHelicobacter pylori感染識別に関する検討~特徴統合と識別結果統合の識別精度比較~
    石原賢太, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 191, 196, 2015年02月16日
    日本語
  • 映像と視聴動作の関連性に基づくユーザの嗜好の推定に関する検討―視聴動作データが少数の場合の精度劣化低減手法の実現―
    山口由晃, 小川貴弘, 浅水仁, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 253, 256, 2015年02月16日
    日本語
  • 検索結果の評価を用いた類似画像検索の高精度化に関する検討―電子顕微鏡により撮像された生物の表面構造の類似度評価への応用―
    高橋昌弘, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 114, 460(IE2014 67-86), 83, 88, 2015年02月16日
    日本語
  • Video Genre Estimation from Relationship between Motion and Facial Features using SLPCCA
    Yuma Sasaka, Takahiro Ogawa, Miki Haseyama, 2015 IEEE 4TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 250, 251, 2015年
    In this paper, we propose an efficient video genre estimation method based on the relationship between facial features and motion features. In the proposed method, we utilize supervised locality preserving canonical correlation analysis (SLPCCA), which is derived in the proposed method, to maximize the correlation between facial features and motion features. Moreover, by using SLPCCA, we can consider not only the correlation but also class information. Finally, by applying Support Vector Machine (SVM) to the SLPCCA-based feature vectors, we realize a successful video genre estimation. Experimental results show the effectiveness of our method., IEEE, 英語
  • Web Image Visualization Considering Image Content Based on Visual and Tag Features
    Kouhei Tateno, Takahiro Ogawa, Miki Haseyama, 2015 IEEE 4TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 254, 255, 2015年
    This paper presents a Web image visualization considering image content based on visual and tag features. In this paper, we focus on tagged images on social media websites. Since these tags represent the image content according to the subjectivity of the user, using these tags is efficient for the image visualization. Thus, by using visual and tag features, the proposed method can take account of the semantic contents. Specifically, the proposed method applies Locality Preserving Canonical Correlation Analysis (LPCCA) to these two features to obtain the dimensionality reduction results, i.e., the visualization result., IEEE, 英語
  • Image Classification Based on Integration of EEG and Visual Features Via LFDA-MSLPCCA
    Kento Sugata, Takahiro Ogawa, Miki Haseyama, 2015 IEEE 4TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 513, 514, 2015年
    This paper presents a novel image classification based on the integration of EEG and visual features. In the proposed method, we first obtain classification results by separately using EEG and visual features. Then we merge the above classification results based on kernelized version of Supervised Learning from Multiple Experts (KSLME) via Multiset Supervised Locality Preserving Canonical Correlation Analysis (MSLPCCA) to obtain final classification results. It should be noted that when the number of samples is fewer than the dimension of a sample data used in MSLPCCA, we have to reduce the dimension. Therefore, we propose MSLPCCA based on Local Fisher Discriminant Analysis (LFDA) which can take class information into account. Then the integration of all of the classifications results becomes feasible by MSLPCCA based on LFDA., IEEE, 英語
  • Helicobacter Pylori Infection Detection From Gastric X-ray Images Using KLFDA-based Decision Fusion
    Kenta Ishihara, Takahiro Ogawa, Miki Haseyama, 2015 IEEE 4TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 204, 205, 2015年
    This paper presents the performance improvement of Helicobacter pylori (H.pylori) infection detection using Kernel Local Fisher Discriminant Analysis (KLFDA)-based decision fusion. As the biggest contribution of this paper, the proposed method extracts more discriminative features based on KLFDA for the decision fusion. Since the decision fusion employed in this paper can consider not only the detection results but also the visual features, by calculating more discriminative features via KLFDA, more accurate decision fusion becomes feasible. Furthermore, experimental results show the effectiveness of the proposed method., IEEE, 英語
  • A new approach with IFS for image restoration
    Miki Haseyama, Megumi Takezawa, Junichi Miura, Hideo Kitajima, European Signal Processing Conference, 2015-March, 2015年01月01日
    © 2000 EUSIPCO.This paper proposes a new image-restoration method based on Iterated Function System (IFS). The proposed method can restore images contaminated by impulsive noise according to self-similarity represented by the IFS parameters. Since the IFS is usually used for image coding, it has never been applied to image restoration; and it cannot be utilized for the image restoration as it is. In order to adapt the IFS for image restoration, this paper reforms the conventional criterion for the computation of the IFS parameters to suit for image restoration, and as preprocessing we apply an e-filter in which a median filter is embedded to contaminated images prior to computing the IFS parameters. Some simulation results are presented to demonstrate the effectiveness of this method.
  • Automatic martian dust storm detection from multiple wavelength data based on decision level fusion
    Keisuke Maeda, Takahiro Ogawa, Miki Haseyama, IPSJ Transactions on Computer Vision and Applications, 7, 79, 83, 2015年
    This paper presents automatic Martian dust storm detection from multiple wavelength data based on decision level fusion. In our proposed method, visual features are first extracted from multiple wavelength data, and optimal features are selected for Martian dust storm detection based on the minimal-Redundancy-Maximal-Relevance algorithm. Second, the selected visual features are used to train the Support Vector Machine classifiers that are constructed on each data. Furthermore, as a main contribution of this paper, the proposed method integrates the multiple detection results obtained from heterogeneous data based on decision level fusion, while considering each classifier's detection performance to obtain accurate final detection results. Consequently, the proposed method realizes successful Martian dust storm detection., Information Processing Society of Japan, 英語
  • Estimation of video authenticity through collaborative use of available video signals
    Michael Penkov, Takahiro Ogawa, Miki Haseyama, ITE Transactions on Media Technology and Applications, 3, 3, 214, 225, 2015年
    This paper proposes a method for identifying the video that retains the most information from its parent video. Since the parent video is often unavailable, the proposed method estimates its content through the collaborative use of the available video signals that are edited copies of the parent video. By reducing the difference between the video signals of the edited videos, the proposed method then enables the use of conventional no-reference video quality assessment algorithms. Since editing a video requires recompressing it, and since quality assessment algorithms can detect signs of recompression, the proposed method can identify the edited video that retains the most information from the parent video. The effectiveness of the proposed method is verified by subjective experiments over artifical and real-world data sets that include a total of over 400 videos., Institute of Image Information and Television Engineers, 英語
  • LDA-based Music Recommendation with CF-based Similar User Selection
    Shohei Kinoshita, Takahiro Ogawa, Miki Haseyama, 2015 IEEE 4TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 215, 216, 2015年
    This paper presents a Latent Dirichlet Allocation (LDA)-based music recommendation method with collaborative filtering (CF)-based similar user selection. By applying LDA to music, we can estimate latent topics of music. However, we have to effectively reduce the size of the target dataset applied to LDA in order to recommend music from a large dataset. Hence, we use CF techniques, which recommend items using evaluation information of users who have similar tastes to a target user. Therefore, the proposed method limits the size of the dataset by using information of similar users and enables the recommendation of music considering latent topics of music. By using the idea of CF, our method can use LDA for music recommendation. Experimental results show the effectiveness of our method., IEEE, 英語
  • Missing Texture Reconstruction via Power Spectrum-based Sparse Representation
    Yuma Tanaka, Takahiro Ogawa, Miki Haseyama, 2015 IEEE 4TH GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 221, 222, 2015年
    This paper presents a method for missing texture reconstruction via power spectrum-based sparse representation. We reconstruct missing areas based on minimizing the mean square error between power spectra (P-MSE). In our method, missing areas are reconstructed by embedding some known patches. Mathematically, we obtain the optimal linear combination of measurement patches by P-MSE minimization. The optimization can be solved as a combinatorial problem based on sparse representaion. In this way, the optimal approximation which minimizes the P-MSE is obtained and we embed it in the missing area. Experimental results show effectiveness of our method for reconstructing texture images., IEEE, 英語
  • Extended Joint Bilateral Filter for the Reduction of Color Bleeding in Compressed Image and Video
    Naofumi Wada, Masato Kazui, Miki Haseyama, ITE Transactions on Media Technology and Applications, 3, 1, 95, 106, 2015年
    In this paper, we propose a simple and effective technique, named extended joint bilateral filter, for reducing color bleeding which is defined as a smearing of the color between areas of strongly contrasting chroma in lossy-compressed images. The color bleeding comes from not only quantization but also sub-sampling in the YCbCr 4:2:0 color format. In order to deal with the two problems simultaneously, we extend the joint bilateral filter formulation by referring all of Y, Cb and Cr components based on a correlation between luma and chroma. As a result, our method achieves both noise reduction and sharpness enhancement for chroma without color edge blurring. Experimental results show that our method is effective in terms of both objective quality and subjective quality., Institute of Image Information and Television Engineers, 英語
  • 胃X線画像を用いた胃がん発症リスクの推定―リスク推定に用いる分類手法の比較による初期検討―
    石原賢太, 小川貴弘, 長谷山美紀, 信号処理シンポジウム講演論文集(CD-ROM), 30th, ROMBUNNO.C4‐5, 2015年
    日本語
  • グラフ構造に基づくリランキングを利用したWeb映像検索に関する検討~初期検索結果の誤りを考慮した最適化に基づく高精度化~
    吉田壮, 小川貴弘, 長谷山美紀, 信号処理シンポジウム講演論文集(CD-ROM), 30th, ROMBUNNO.A2‐3, 2015年
    日本語
  • 胃X線画像を用いたHelicobacter pylori感染の高精度識別に関する検討(1)―識別精度向上に有効な画像領域の抽出手法―
    藤後廉, 石原賢太, 小川貴弘, 長谷山美紀, 信号処理シンポジウム講演論文集(CD-ROM), 30th, ROMBUNNO.C4‐4, 2015年
    日本語
  • 画像注視時の脳波特徴量を用いた画像分類に関する検討(5)―KESLMEを用いた教師あり分類結果統合に基づく高精度化―
    菅田健斗, 小川貴弘, 長谷山美紀, 信号処理シンポジウム講演論文集(CD-ROM), 30th, ROMBUNNO.A5‐4, 2015年
    日本語
  • ネットワーク解析を用いたサッカー映像における重要選手と類似場面の検出に関する一考察 (メディア工学)
    高橋 翔, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 51, 1, 4, 2014年12月05日
    本稿では,サッカー映像における重要選手および類似場面をネットワーク解析によって検出し,その有効性について考察する.本稿における重要選手とは,攻撃チームにおいてシュートを行う選手とその選手に対してパスを行う選手および,守備チームにおいてボールを奪取する選手とそれをカバーリングする選手であり,それぞれサッカー戦術と強く関連する.サッカー戦術の分析は,選手個々のスキル以外に,選手同士が連携したプレイに注目して行うことが特に重要である.そこで提案手法では,選手同士の連携をサッカー映像中の選手位置から求める選手間ネットワークで表現し,そのネットワークを解析することで注目する場面における重要選手と類似場面の検出を試みる., 一般社団法人映像情報メディア学会, 日本語
  • 視聴動作に基づくユーザの関心対象を考慮した映像に対する関心の有無の識別に関する検討
    山口由晃, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.165, 2014年10月25日
    日本語
  • トピックモデルを用いた複数特徴の統合による画像群の可視化に関する検討
    館農浩平, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.136, 2014年10月25日
    日本語
  • 画像共有サイトへの投稿画像およびそのメタデータに注目したマルチモーダル画像検索手法に関する検討
    斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.141, 2014年10月25日
    日本語
  • Web映像検索のための意味内容を考慮したWebコミュニティの階層構造抽出に関する一検討
    竹原大智, 原川良介, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.164, 2014年10月25日
    日本語
  • 複数の画像特徴を用いたベイジアンネットワークに基づく構造物の変状の推定の高精度化に関する検討
    前田圭介, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.140, 2014年10月25日
    日本語
  • パワースペクトログラム誤差最小化に基づく消失音響区間の再構成手法に関する検討
    田中佑磨, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.135, 2014年10月25日
    日本語
  • 維持管理業務の効率化に向けた点検データの類似度算出における特徴選択に関する検討
    三改木裕矢, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.139, 2014年10月25日
    日本語
  • トピックモデルに基づく音響特徴と時間情報を考慮した流行曲識別に関する検討
    木下奨平, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014, ROMBUNNO.134, 2014年10月25日
    日本語
  • A Note on Improving Video Authenticity Degree Estimation through Automatic Speech Recognition (画像工学)
    PENKOV Michael, OGAWA Takahiro, HASEYAMA Miki, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 434, 341, 346, 2014年02月17日
    電子情報通信学会, 英語
  • 画像注視時の脳波特徴量を用いた画像分類に関する検討(2)単一試行の脳波から算出された特徴量の有効性の検証 (ITS)
    川上 拓也, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 199, 204, 2014年02月17日
    電子情報通信学会, 日本語
  • タグ付き画像を用いた同一意味を表現するタグの選択に関する検討 (ITS)
    宋 妍, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 211, 216, 2014年02月17日
    電子情報通信学会, 日本語
  • 可視および近赤外領域に感度を有するディジタルカメラを用いた分光反射率推定に関する検討 : 光源スペクトル推定の導入 (ITS)
    五十嵐 祐太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 223, 228, 2014年02月17日
    電子情報通信学会, 日本語
  • 昆虫の走査型電子顕微鏡像による科の分類に関する検討 : 画像特徴を用いた階層型クラスタリングによる高精度化 (ITS)
    高橋 昌弘, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 241, 246, 2014年02月17日
    電子情報通信学会, 日本語
  • 生物の顕微鏡像を用いた科の推定に関する検討 : 分類体系を表す決定木の改良による高精度化 (ITS)
    朴 君, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 247, 252, 2014年02月17日
    電子情報通信学会, 日本語
  • Web映像コミュニティの階層構造抽出の大規模データ適用に関する一検討 (ITS)
    原川 良介, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 275, 280, 2014年02月17日
    電子情報通信学会, 日本語
  • Hidden Conditional Random Fieldsによる映像の構造解析に基づくシーン分割の高精度化に関する検討 (ITS)
    吉田 壮, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 285, 290, 2014年02月17日
    電子情報通信学会, 日本語
  • 個人の嗜好を表現可能なトピックモデルの提案とその楽曲推薦への応用に関する検討 (ITS)
    中西 亮太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 313, 318, 2014年02月17日
    電子情報通信学会, 日本語
  • カルマンフィルタを用いたエラーコンシールメントの高精度化に関する検討 : 物体の運動を考慮した状態遷移モデルの実現 (ITS)
    大貫 修平, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 325, 330, 2014年02月17日
    電子情報通信学会, 日本語
  • 動画像の事例ベース超解像のランク最小化に基づく高精度化に関する検討 (ITS)
    廣川 真梨子, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 433, 347, 350, 2014年02月17日
    電子情報通信学会, 日本語
  • 橋梁の点検画像を用いたベイジアンネットワークによる変状の推定に関する検討
    小林克希, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 113, 434(IE2013 95-132), 217, 221, 2014年02月10日
    日本語
  • ネットワーク分析を用いたサッカー選手の特徴定義とその選手間類似度算出への応用
    岩井和也, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 113, 434(IE2013 95-132), 319, 324, 2014年02月10日
    日本語
  • 色品質改善のための拡張ジョイントバイラテラルフィルタ—Extended Joint Bilateral Filtering for Color Quality Enhancement—画像工学
    和田 直史, 数井 誠人, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 434, 1, 6, 2014年02月
    東京 : 電子情報通信学会, 日本語
  • 色品質改善のための拡張ジョイントバイラテラルフィルタ (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    和田 直史, 数井 誠人, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 1, 6, 2014年02月
    映像情報メディア学会, 日本語
  • 個人の嗜好を表現可能なトピックモデルの提案とその楽曲推薦への応用に関する検討 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    中西 亮太, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 313, 318, 2014年02月
    映像情報メディア学会, 日本語
  • 動画像の事例ベース超解像のランク最小化に基づく高精度化に関する検討 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    廣川 真梨子, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 347, 350, 2014年02月
    映像情報メディア学会, 日本語
  • A Note on Improving Video Authenticity Degree Estimation through Automatic Speech Recognition (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    PENKOV Michael, OGAWA Takahiro, HASEYAMA Miki, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 341, 346, 2014年02月
    映像情報メディア学会, 英語
  • 可視および近赤外領域に感度を有するディジタルカメラを用いた分光反射率推定に関する検討 : 光源スペクトル推定の導入 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    五十嵐 祐太, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 223, 228, 2014年02月
    映像情報メディア学会, 日本語
  • 昆虫の走査型電子顕微鏡像による科の分類に関する検討 : 画像特徴を用いた階層型クラスタリングによる高精度化 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    高橋 昌弘, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 241, 246, 2014年02月
    映像情報メディア学会, 日本語
  • 画像注視時の脳波特徴量を用いた画像分類に関する検討(2)単一試行の脳波から算出された特徴量の有効性の検証 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    川上 拓也, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 199, 204, 2014年02月
    映像情報メディア学会, 日本語
  • タグ付き画像を用いた同一意味を表現するタグの選択に関する検討 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    宋 妍, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 211, 216, 2014年02月
    映像情報メディア学会, 日本語
  • 生物の顕微鏡像を用いた科の推定に関する検討 : 分類体系を表す決定木の改良による高精度化 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    朴 君, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 247, 252, 2014年02月
    映像情報メディア学会, 日本語
  • Hidden Conditional Random Fieldsによる映像の構造解析に基づくシーン分割の高精度化に関する検討 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    吉田 壮, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 285, 290, 2014年02月
    映像情報メディア学会, 日本語
  • Web映像コミュニティの階層構造抽出の大規模データ適用に関する一検討 (メディア工学 映像表現&コンピュータグラフィックス ヒューマンインフォメーション)
    原川 良介, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 38, 7, 275, 280, 2014年02月
    映像情報メディア学会, 日本語
  • 色品質改善のための拡張ジョイントバイラテラルフィルタ
    和田直史, 数井誠人, 長谷山美紀, 電子情報通信学会技術研究報告, 113, 434(IE2013 95-132), 2014年
  • バイオミメティクス・データ検索基盤と新材料開発
    長谷山美紀, 高分子学会予稿集(CD-ROM), 63, 2, 2014年
  • Exhibition Method of Hierarchical Structure of Web Communities Using Community Density for Web Video Retrieval
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, 18TH IEEE INTERNATIONAL SYMPOSIUM ON CONSUMER ELECTRONICS (ISCE 2014), 2014年
    In this paper, we present an exhibition method of hierarchical structure of Web communities using community density for Web video retrieval. In the proposed method, Web communities that are Web video sets with similar topics is hierarchically extracted by using hyperlinks between Web videos and their video features, and density of each Web community is estimated. Then we exhibit the hierarchical structure of Web communities according to the obtained density to users. Since users can grasp detail degree of topics contained in each Web community, the desired Web community can be easily selected for Web video retrieval., IEEE, 英語
  • エントモミメティクスと害虫制御
    針山孝彦, 針山孝彦, 魚津吉弘, 向井裕美, 山濱由美, 弘中満太郎, 高久康春, 高久康春, 石井大佑, 石井大佑, 大原昌宏, 大原昌宏, 野村周平, 野村周平, 長谷山美紀, 長谷山美紀, 原滋郎, 下澤楯夫, 下澤楯夫, 下村政嗣, 下村政嗣, 日本応用動物昆虫学会誌, 58, 2, 79, 91, 2014年
    JAPAN SOC APPL ENTOMOL ZOOL, 日本語
  • An efficient extraction method of hierarchical structure of web communities for web video retrieval
    Ryosuke Harakawa, Takahiro Ogawa, Miki Haseyama, ITE Transactions on Media Technology and Applications, 2, 3, 287, 297, 2014年
    In this paper, we propose a method that enables efficient extraction of hierarchical structure of Web communities containing Web videos that have similar topics in order to retrieve users' desired Web videos. Specifically, the proposed method first calculates Web video features by applying canonical correlation analysis to a small number of Web video samples obtained on the basis of a clustering scheme. Furthermore, we construct a "community graph" of which each node consists of multiple Web videos and each edge corresponds to hyperlinks of Web pages including these videos. Then, based on strongly connected components, edge betweenness and modularity of the community graph, hierarchical structure of Web communities is estimated. In this way, our method can efficiently extract the hierarchical structure of Web communities, and users' desired Web videos can be retrieved by selecting Web communities according to their hierarchical structure., Institute of Image Information and Television Engineers, 英語
  • Popular Music Estimation Based on Topic Model Using Time Information and Audio Features
    Shohei Kinoshita, Takahiro Ogawa, Miki Haseyama, 2014 IEEE 3RD GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 102, 103, 2014年
    This paper presents popular music estimation based on a topic model using time information and audio features. The proposed method calculates latent topic distribution using Latent Dirichlet Allocation to obtain more accurate music features. In this approach, we also use release date information of each music as time information for concerning the relationship between music trends and each age. Then, by using the obtained latent topic distribution features, the estimation of the popular music becomes feasible based on a Support Vector Machine classifier. Experimental results show the effectiveness of our method., IEEE, 英語
  • Missing Audio Segment Reconstruction Based on Sparse Representation with Power Spectrogram
    Yuma Tanaka, Takahiro Ogawa, Miki Haseyama, 2014 IEEE 3RD GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 86, 87, 2014年
    This paper presents a method for reconstructing missing audio segments based on sparse representation with power spectrogram. In the proposed method, an error of power spectrograms is utilized as a quality measure representing reconstruction performance. Then the proposed method estimates missing segments based on sparse representation optimized with respect to the error of power spectrograms. This error minimization problem can be solved with a greedy algorithm by limitting the solution to only sparse one. By using our method, perceptually optimized reconstruction becomes feasible since missing segments are estimated by using the quality measure which represens auditory properties. Experimental results obtained by applying the proposed method to actual music signals from RWC Music Database show its effectiveness., IEEE, 英語
  • Effective Multiple Feature Fusion Using Topic Model for Social Image Visualization
    Kouhei Tateno, Takahiro Ogawa, Miki Haseyama, 2014 IEEE 3RD GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 182, 183, 2014年
    This paper presents a multiple feature fusion method using topic model for social image visualization. Images in social media are represented from several aspects such as their visual information and tags. The proposed method extracts low-level features from social images and their tags and calculates their integrated high-level features. Specifically, the proposed method applies multilayer multimodal probabilistic Latent Semantic Analysis (mm-pLSA) to the low-level visual and tag features to obtain the high-level features. Then, by applying dimensionality reduction techniques to the obtained features, successful visualization becomes feasible., IEEE, 英語
  • Bayesian Network-based Distress Estimation Using Image Features in Road Structure Assessment
    Keisuke Maeda, Sho Takahashi, Takahiro Ogawa, Miki Haseyama, 2014 IEEE 3RD GLOBAL CONFERENCE ON CONSUMER ELECTRONICS (GCCE), 169, 170, 2014年
    This paper presents a Bayesian network-based method for estimating a distress of road structures from inspection data. The distress is represented by a damage of road structures and its degree. In the previous work, the distress was estimated by utilizing Bayesian network based on categories of road structures, details of road structures and damaged parts. However, inspection data include not only the above items but also images of the distress. Therefore, by introducing the use of the images to the previous work, improvement of the distress estimation accuracy can be expected. The proposed method calculates Bayesian network from inspection items and their corresponding images to perform the distress estimation. Experimental results show the effectiveness of the proposed method., IEEE, 英語
  • Welcome to the Special Section on ITE Awards Selection
    Miki Haseyama, ITE Transactions on Media Technology and Applications, 2, 1, 51, 51, 2014年01月01日
    一般社団法人 映像情報メディア学会, 英語
  • A compressed sensing-based low-density parity-check real-number code
    Zaixing He, Takahiro Ogawa, Miki Haseyama, Xinyue Zhao, Shuyou Zhang, Radioengineering, 22, 3, 851, 860, 2013年10月22日
    In this paper, we propose a novel low-density parity-check real-number code, based on compressed sensing. A real-valued message is encoded by a coding matrix (with more rows than columns) and transmitted over an erroneous channel, where sparse errors (impulsive noise) corrupt the codeword. In the decoding procedure, we apply a structured sparse (low-density) parity-check matrix, the Permuted Block Diagonal matrix, to the corrupted output, and the errors can be corrected by solving a compressed sensing problem. A compressed sensing algorithm, Cross Low-dimensional Pursuit, is used to decode the code by solving this compressed sensing problem. The proposed code has high error correction performance and decoding efficiency. The comparative experimental results demonstrate both advantages of our code. We also apply our code to cryptography., SPOLECNOST PRO RADIOELEKTRONICKE INZENYRSTVI, 英語
  • 脳波特徴に基づく人間の楽曲聴取時における感情推定に関する検討
    澤田充奨, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013, ROMBUNNO.171, 2013年10月19日
    日本語
  • 判別分析に基づいた順序回帰の導入による協調フィルタリングでのSparsity Problemの軽減に関する一検討
    川島孝行, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013, ROMBUNNO.172, 2013年10月19日
    日本語
  • 胃X線二重造影像を用いたHelicobacter pylori感染の識別の高精度化に関する検討
    石原賢太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013, ROMBUNNO.165, 2013年10月19日
    日本語
  • 重み付きロバストPCAを用いた動画像フレーム補間の高精度化に関する検討
    廣川真梨子, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013, ROMBUNNO.174, 2013年10月19日
    日本語
  • 画像検索結果提示法におけるユーザの探索時間と特徴量との関係に関する一考察
    三改木裕矢, 小林克希, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013, ROMBUNNO.160, 2013年10月19日
    日本語
  • ベイジアンネットワークを用いた構造物の点検データからの変状の推定
    小林克希, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013, ROMBUNNO.173, 2013年10月19日
    日本語
  • 3D DWTビデオ伝送のビット誤り耐性の強化 (スマートインフォメディアシステム)
    大村 光德, 山嵜 彰一郎, 松嶋 智子, 田中 宏和, 長谷山 美紀, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 202, 1, 6, 2013年09月12日
    3次元離散ウェーブレット変換(3D DWT)を用いて符号化されたビデオ伝送における誤り耐性強化の方式として,共著者らにより3D DWT出力の最低周波数成分(LL)の二重化方式が提案されている.本稿ではLL係数二重化のビット数を減らし,LL隣接係数を二重化する方式,および誤りのある係数を値"ゼロ"に置換することにより修復する,誤り耐性強化方式を提案する.伝送路にバースト誤りモデルを適用したシミュレーションにより比較評価を行い,PSNRおよびビデオの再生画質において,提案方式による誤り耐性強化の有効性が確認された., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるパス可能領域の高精度な推定手法に関する検討 : 選手配置の時刻変化を導入した新たな評価関数の定義 (ITS)
    高橋 翔, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 153, 158, 2013年02月18日
    電子情報通信学会, 日本語
  • ベイジアンネットワークを用いた除雪作業データの分析に関する検討 (ITS)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 39, 43, 2013年02月18日
    電子情報通信学会, 日本語
  • 視聴動作から推定される関心度を用いた映像の推薦の高精度化に関する検討 (ITS)
    白石 哲夫, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 95, 100, 2013年02月18日
    電子情報通信学会, 日本語
  • 歌謡番組における映像の構造に注目したシーン分割手法 : 顔認識のシーン分割精度に与える効果の検証 (ITS)
    吉田 壮, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 101, 106, 2013年02月18日
    電子情報通信学会, 日本語
  • ポピュラー音楽データベースにおけるトレンド検出に関する検討 (ITS)
    中西 亮太, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 107, 110, 2013年02月18日
    電子情報通信学会, 日本語
  • 音響特徴量に基づくクラシック音楽の分類に関する一考察 (ITS)
    松野 恵一, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 111, 115, 2013年02月18日
    電子情報通信学会, 日本語
  • 映像検索結果の定量評価手法の応用に関する試み(1)札幌市における実証実験を通した映像検索システムの評価 (ITS)
    山之内 豊, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 159, 163, 2013年02月18日
    電子情報通信学会, 日本語
  • 特徴統合理論に基づく画像検索結果の提示法の評価 : 異なる提示法の比較による有効性の検証 (ITS)
    小林 克希, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 112, 433, 165, 169, 2013年02月18日
    電子情報通信学会, 日本語
  • ベイジアンネットワークを用いた除雪作業データの分析に関する検討 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 39, 43, 2013年02月11日
    映像情報メディア学会, 日本語
  • 視聴動作から推定される関心度を用いた映像の推薦の高精度化に関する検討 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    白石 哲夫, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 95, 100, 2013年02月11日
    映像情報メディア学会, 日本語
  • 歌謡番組における映像の構造に注目したシーン分割手法 : 顔認識のシーン分割精度に与える効果の検証 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    吉田 壮, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 101, 106, 2013年02月11日
    映像情報メディア学会, 日本語
  • ポピュラー音楽データベースにおけるトレンド検出に関する検討 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    中西 亮太, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 107, 110, 2013年02月11日
    映像情報メディア学会, 日本語
  • 音響特徴量に基づくクラシック音楽の分類に関する一考察 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    松野 恵一, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 111, 115, 2013年02月11日
    映像情報メディア学会, 日本語
  • 映像検索結果の定量評価手法の応用に関する試み(1)札幌市における実証実験を通した映像検索システムの評価 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    山之内 豊, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 159, 163, 2013年02月11日
    映像情報メディア学会, 日本語
  • 特徴統合理論に基づく画像検索結果の提示法の評価 : 異なる提示法の比較による有効性の検証 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    小林 克希, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 165, 169, 2013年02月11日
    映像情報メディア学会, 日本語
  • 野球映像における投手のコンディション推定の高精度化に関する検討 投球動作および投球結果を表す特徴量の改良
    久保純貴, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 112, 434(IE2012 110-137), 141, 146, 2013年02月11日
    日本語
  • 胃X線二重造影像を用いたHelicobacter pylori感染の識別に関する検討
    吉崎茜, 桂井麻里衣, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 112, 434(IE2012 110-137), 25, 28, 2013年02月11日
    日本語
  • 弾性モデルを用いたサッカーの選手追跡に関する検討~新たなポテンシャルエネルギーの導入による高精度化~
    岩井和也, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 112, 434(IE2012 110-137), 135, 139, 2013年02月11日
    日本語
  • ボール保持チームに注目したサッカー映像分割の高精度化に関する検討
    大貫修平, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 112, 434(IE2012 110-137), 147, 151, 2013年02月11日
    日本語
  • 道路映像中のシカ検出のための画像特徴量に関する検討 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    桂井 麻里衣, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 125, 128, 2013年02月
    映像情報メディア学会, 日本語
  • 犯罪捜査における足跡鑑定のための靴裏画像検索に関する検討 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    畠山 泰貴, 長谷山 美紀, 映像情報メディア学会技術報告 = ITE technical report, 37, 8, 171, 175, 2013年02月
    映像情報メディア学会, 日本語
  • 犯罪捜査における足跡鑑定のための靴裏画像検索に関する検討
    畠山泰貴, 長谷山美紀, 電子情報通信学会技術研究報告, 112, 434(IE2012 110-137), 2013年
  • 道路映像中のシカ検出のための画像特徴量に関する検討
    桂井麻里衣, 長谷山美紀, 電子情報通信学会技術研究報告, 112, 434(IE2012 110-137), 2013年
  • インバーティブル誤り訂正符号を利用した3D DWTビデオ伝送の誤り耐性強化
    大村光徳, 山嵜彰一郎, 松嶋智子, 田中宏和, 長谷山美紀, 電子情報通信学会技術研究報告, 113, 153(IT2013 11-31), 2013年
  • 工学的気づきを生み出すバイオミメティクスデータ検索基盤
    長谷山美紀, 高分子夏季大学講演予稿集, 58th, 2013年
  • ビッグデータからの価値創出-「気づき」を生み出す画像検索-
    長谷山美紀, 電子情報通信学会技術研究報告, 113, 218(EMCJ2013 49-59), 2013年
  • ビデオ伝送における誤り耐性強化の研究
    大村光徳, 山嵜彰一郎, 松嶋智子, 田中宏和, 長谷山美紀, 職業大フォーラム 職業能力開発研究発表講演会講演論文集, 21st, 2013年
  • 変状評価の支援を目的とした点検データの可視化に関する検討
    高橋翔, 小川貴弘, 長谷山美紀, 日本道路会議論文集(CD-ROM), 30th, ROMBUNNO.2053, 2013年
    日本語
  • A method for improving SVM-Based image classification performance based on a target object detection scheme
    Soh Yoshida, Hiroshi Okada, Takahiro Ogawa, Miki Haseyama, ITE Transactions on Media Technology and Applications, 1, 3, 237, 243, 2013年
    This paper presents a new method to improve performance of SVM-based classification, which contains a target object detection scheme. The proposed method tries to detect target objects from training images and improve the performance of the image classification by calculating the hyperplane from the detection results. Specifically, the proposed method calculates a Support Vector Machine (SVM) hyperplane, and detects rectangular areas surrounding the target objects based on the distances between their feature vectors and the separating hyperplane in the feature space. Then modification of feature vectors becomes feasible by removing features that exist only in background areas. Furthermore, a new hyperplane is calculated by using the modified feature vectors. Since the removed features are not part of the target object, they are not relevant to the learning process. Therefore, their removal can improve the performance of the image classification. Experimental results obtained by applying the proposed methods to several existing SVM-based classification method show its effectiveness., Institute of Image Information and Television Engineers, 英語
  • A review of broadcasting technology: From production to distribution
    Nobuyuki Yagi, Norifumi Egami, Naoki Shimidzu, Miki Haseyama, ITE Transactions on Media Technology and Applications, 1, 1, 10, 19, 2013年01月01日
    Copyright © 2013 by ITE Transactions on Media Technology and Applications (MTA).This paper presents a survey of research trends in broadcasting technology from production to distribution and from fundamentals to applications. It briefly reviews work being done on UHDTV, 3DTV, IPTV, hybrid broadcasting, transmission technology, audio-visual coding, image sensing devices, display devices, media accessibility, content production, metadata, and content management., INST IMAGE INFORMATION & TELEVISION ENGINEERS, 英語, 書評論文,書評,文献紹介等
  • Active grid-Based pass region estimation from multiple frames of broadcast soccer videos
    Sho Takahashi, Miki Haseyama, ITE Transactions on Media Technology and Applications, 1, 3, 220, 225, 2013年
    An Active grid-based method for estimating pass regions from broadcast soccer videos is presented in this paper. It is assumed that the pass region has a high probability of the pass succeeding. In soccer matches, players discover pass regions based on previous and current player positions. In conventional methods, pass regions are estimated by applying Active Net to only a single frame of a soccer video. In the proposed method, Active grid is applied to three-dimensional data by which frames of the soccer video are connected with the temporal dimension. The proposed method then realizes robust estimation of pass regions based on multiple frames of player positions. The proposed method was applied to actual TV programs to verify its effectiveness., Institute of Image Information and Television Engineers, 英語
  • Novel evaluation criterion for visualization of image search results based on feature integration theory
    Katsuki Kobayashi, Takahiro Ogawa, Miki Haseyama, ITE Transactions on Media Technology and Applications, 1, 4, 333, 342, 2013年
    This paper presents a new evaluation criterion for visualization of image search results based on the feature integration theory. This criterion is derived by combining two elements, visual saliency on visualization and grouping degree of similar images. Visual saliency, which is calculated from the feature integration theory, on visualization of image search results enables representation of users' attention, which is closely related to the effectiveness of finding images. Furthermore, since users perceive similar images that are close to each other as one group, grouping degree of similar images enables evaluation of the effectiveness when users find images similar to a desired image. Therefore, by combining visual saliency on visualization and grouping degree of similar images, we can derive the novel criterion and evaluate the effectiveness of visualization of image search results., Institute of Image Information and Television Engineers, 英語
  • A review of video retrieval based on image and video semantic understanding
    Miki Haseyama, Takahiro Ogawa, Nobuyuki Yagi, ITE Transactions on Media Technology and Applications, 1, 1, 2, 9, 2013年
    Research trends in new video retrieval based on image and video semantic understanding are presented in this paper. First, recent studies related to image and video semantic analysis are introduced to understand leading-edge multimedia retrieval technologies. Several works related to visualization interfaces for multimedia retrieval are also presented. Finally, trends in state-of-the-art studies and the future outlook are described., Institute of Image Information and Television Engineers, 英語, 書評論文,書評,文献紹介等
  • Quality estimation method for fractal compressed images
    Megumi Takezawa, Hirofumi Sanada, Miki Haseyama, ITE Transactions on Media Technology and Applications, 1, 2, 178, 183, 2013年
    A method for estimating the quality of images compressed by fractal image compression is presented in this paper. Fractal image compression based on an iterated function system is one of the compression techniques for digital images. It utilizes the self-similarity of images and achieves high image-compression performance. However, fractal image compression is currently not being in widespread use because it does not necessarily provide high-quality compressed images. We cannot determine whether a given image is unsuitable for fractal image compression without encoding it. Therefore, in this paper, we propose a new criterion for estimating the suitability of fractal image compression for a given image. By using the proposed criterion, we can estimate the quality of the compressed image in a short time without actually encoding the image., Institute of Image Information and Television Engineers, 英語
  • Glare detection for night wet road surfaces and driver visibility improvement by using multiple onboard cameras
    Hiroaki Kumon, Miki Haseyama, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 67, 3, J95, J103, 2013年
    Driver's visibility diminishes severely in rainy conditions at night. The glare on wet road surfaces causes this poor visibility. In this paper, we propose an image processing method that detects the glare on wet road surfaces by Using multiple onboard cameras. We also propose an image generating method that reduces the effect of glare. By Using our method, glare-reduced images can be obtained and by displaying these images on the monitor equipped in the vehicle, the number of traffic accidents can be reduced. The proposed method is based on the characteristic that the road plane has a common planar surface in multiple camera images. By Using this characteristic and a homography matrix, the glare can be detected. Experimental results obtained by applying the proposed method to real image data show its high performance., 日本語
  • Error Resilient 3D DWT Video Transmission Using Invertible Codes
    Kotoku Omura, Shoichiro Yamasaki, Tomoko K. Matsushima, Hirokazu Tanaka, Miki Haseyama, 2013 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATIONS SYSTEMS (ISPACS), 180, 185, 2013年
    There have been many studies that apply three-dimensional discrete wavelet transform (3D DWT) to video coding. It is known that lowest frequency sub-band coefficients of 3D DWT outputs affect the visual quality of video. In order to maintain image quality of video that is transmitted over channel with error such as a wireless, it is necessary to development of error resilient transmission scheme for protecting the lowest sub-band coefficients. Coauthors of the study proposed the method (conventional method), which adopted duplication scheme of lowest frequency subband coefficients of 3D DWT. The objective of this study is to indicate improvement of error resilience by replacing the duplication scheme of conventional method with the error correction scheme using invertible codes.
    In addition, conventional study is assumed the packet loss channel model that packets are lost or received without bit errors. However, in wireless communications of the actual, the packet is often received with errors, and errors occur in bursty. The simulation evaluations compare the performances of the proposed method with those of the conventional one over burst error channel., IEEE, 英語
  • A rating prediction method for e-commerce application using ordinal regression based on LDA with multi-modal features
    Takayuki Kawashima, Takahiro Ogawa, Miki Haseyama, 2013 IEEE 2nd Global Conference on Consumer Electronics, GCCE 2013, 260, 261, 2013年
    This paper presents a new method for rating prediction in e-commerce, which uses ordinal regression based on linear discriminant analysis (LDA) with multi-modal features. In order to realize accurate recommendation in e-commerce, the proposed method estimates each user's rating for target items. Note that we define the rating as 'the degree of preference for each item by a user.' For estimating the target user's preference of each item from the past ratings of other items, the proposed method performs training from pairs of 'ratings of items' and their feature vectors using ordinal regression based on LDA. Furthermore, in this approach, new features are obtained by applying canonical correlation analysis (CCA) to textual and visual features extracted from review's texts and images on the Web, respectively. Therefore, higher performance of the rating prediction can be realized by our method than that when using single kind of features. Experimental results obtained by applying the proposed method to an actual movie data set, which has been provided by SNAP, show the effectiveness of the proposed method. © 2013 IEEE., IEEE, 英語
  • Adaptive parameter setting for pass region estimation in soccer videos and its performance verification
    Sho Takahashi, Miki Haseyama, 2013 IEEE 2nd Global Conference on Consumer Electronics, GCCE 2013, 271, 272, 2013年
    This paper proposes an accurate pass region estimation method by introducing adaptive parameter settings. Our previous paper proposed a pass region estimation method by utilizing average values of ball and player velocities. However, such velocities vary according to player density and skill. Therefore, in order to realize a more accurate pass region estimation, the proposed method obtains parameters, which are ball and player velocities, from player positions in a target soccer video. By introducing the above parameter settings to pass region estimation, more realistic pass region can be obtained. Consequently, the accurate method of pass region estimation is realized. © 2013 IEEE., IEEE, 英語
  • 半教師あり学習による走査型電子顕微鏡で撮像された昆虫の識別に関する検討
    高橋昌弘, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.146, 2012年10月20日
    日本語
  • モーフィングを用いた新たな学習データの生成による昆虫の自動分類の高精度化
    朴君, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.125, 2012年10月20日
    日本語
  • 弾性モデルを用いたサッカー映像における選手追跡の高精度化に関する検討
    岩井和也, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.149, 2012年10月20日
    日本語
  • 映像の特徴を用いたWebコミュニティ抽出の高精度化に関する検討―最短リンク経路長の導入による試み―
    原川良介, 畠山泰貴, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.150, 2012年10月20日
    日本語
  • 近赤外光除去フィルタを用いずに取得した画像からの可視光成分の抽出に関する検討
    五十嵐祐太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.162, 2012年10月20日
    日本語
  • 楽曲中の歌唱区間推定における脳波特徴量の導入に関する検討
    川上拓也, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.157, 2012年10月20日
    日本語
  • サポートベクトル回帰を用いたぶれによる劣化画像の復元に関する一検討
    吉崎茜, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.145, 2012年10月20日
    日本語
  • 物体認識における識別器の高精度化に関する検討 SVMを用いた物体領域の自動選定手法の導入
    吉田壮, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.122, 2012年10月20日
    日本語
  • 映像のシーン分割における複数特徴量の協調利用の有効性に関する評価
    宋妍, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.123, 2012年10月20日
    日本語
  • 連想型映像検索における検索過程の分析に関する一考察
    山之内豊, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.153, 2012年10月20日
    日本語
  • クラシック楽曲信号から算出される特徴量の改良と時代分類の高精度化に関する考察
    松野恵一, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.155, 2012年10月20日
    日本語
  • 順序回帰を用いた数値予報の誤差解析における高精度化に関する検討
    高橋信太郎, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.147, 2012年10月20日
    日本語
  • 視聴動作から推定される関心度を用いた映像の推薦に関する検討
    白石哲夫, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.151, 2012年10月20日
    日本語
  • 画像検索結果の提示方法の有効性評価に関する検討―特徴統合理論に基づく評価指標の実現―
    小林克希, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.152, 2012年10月20日
    日本語
  • 歌詞と音響特徴を用いたファジィ分類による音楽ジャンル帰属度の定義に関する検討
    中西亮太, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.156, 2012年10月20日
    日本語
  • サッカーのチーム戦術推定手法を用いた試合映像の分割に関する検討
    大貫修平, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012, ROMBUNNO.148, 2012年10月20日
    日本語
  • 高速道路の構造物の点検・診断業務の効率化に向けた検討
    紫桃孝一郎, 三石晃, 黒田尚士, 石川雄章, 湧田雄基, 長谷山美紀, 小川貴弘, 土木学会年次学術講演会講演概要集(CD-ROM), 67th, ROMBUNNO.VI-237, 2012年08月01日
    日本語
  • Dynamic Coalescence Modelの高速化に関する一考察 (ITS)
    海田 健, 長谷山 美紀, 北島 秀夫, 富田 眞吾, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 11, 14, 2012年02月20日
    クラスタ分析手法(クラスタリング手法)であるDynamic Coalescence Model(DCM)の計算量が削減された,DCMの改良手法を提案する.多くの混合分布において,その構成分布の数は未知であり,形は複雑である.その上,構成分布の位置関係は複雑である.DCMを用いることにより,その様な構成分布を点の集まり(クラスタ)に分割することが可能になる.しかし,DCMが計算量は多いため,実用的でない.提案する改良DCMの計算時間は,オリジナルDCMの計算時間より短い., 一般社団法人電子情報通信学会, 日本語
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討 (ITS)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 313, 317, 2012年02月20日
    本文では,電子レセプトから医療資源を最も投入した傷病を推定する手法を提案する.提案手法では,確率的トピックモデルの一手法であるLabeled LDAにより,傷病に対する診療内容を診療行為,医薬品および特定保険医療材料の確率分布として表し,電子レセプトに記載された複数の傷病に対する診療内容をそれらの混合分布として表すモデルを構築する.この結果を用いることで傷病毎の診療報酬点数の推計を行うことが可能となり,高精度な傷病の推定が実現する., 一般社団法人電子情報通信学会, 日本語
  • Dynamic Coalescence Modelの高速化に関する一考察 (画像工学)
    海田 健, 長谷山 美紀, 北島 秀夫, 富田 眞吾, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 11, 14, 2012年02月20日
    クラスタ分析手法(クラスタリング手法)であるDynamic Coalescence Model(DCM)の計算量が削減された,DCMの改良手法を提案する.多くの混合分布において,その構成分布の数は未知であり,形は複雑である.その上,構成分布の位置関係は複雑である.DCMを用いることにより,その様な構成分布を点の集まり(クラスタ)に分割することが可能になる.しかし,DCMが計算量は多いため,実用的でない.提案する改良DCMの計算時間は,オリジナルDCMの計算時間より短い., 一般社団法人電子情報通信学会, 日本語
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討 (画像工学)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 313, 317, 2012年02月20日
    本文では,電子レセプトから医療資源を最も投入した傷病を推定する手法を提案する.提案手法では,確率的トピックモデルの一手法であるLabeled LDAにより,傷病に対する診療内容を診療行為,医薬品および特定保険医療材料の確率分布として表し,電子レセプトに記載された複数の傷病に対する診療内容をそれらの混合分布として表すモデルを構築する.この結果を用いることで傷病毎の診療報酬点数の推計を行うことが可能となり,高精度な傷病の推定が実現する., 一般社団法人電子情報通信学会, 日本語
  • Dimensionality Reduction of Sparse Visual Features via Recoverable Projection for Large-Scale Image Retrieval (画像工学)
    何 再興, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 1, 6, 2012年02月20日
    電子情報通信学会, 英語
  • 数値予報における予報誤差の解析の高精度化に関する検討 (画像工学)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 7, 10, 2012年02月20日
    電子情報通信学会, 日本語
  • 可視光成分と近赤外光成分が重畳された画像の色補正 : 自然画像の色成分を用いた色変換の検討 (画像工学)
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 21, 25, 2012年02月20日
    電子情報通信学会, 日本語
  • 移動方向を考慮した道路映像中のシカ検出の高精度化に関する検討 (画像工学)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 67, 71, 2012年02月20日
    電子情報通信学会, 日本語
  • 視聴動作から推定される関心度を用いたユーザクラスタリングに関する検討 (画像工学)
    白石 哲夫, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 189, 193, 2012年02月20日
    電子情報通信学会, 日本語
  • A note on the application of Web information to near-duplicate online video detection (画像工学)
    ペンコフ マイケル, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 201, 205, 2012年02月20日
    電子情報通信学会, 英語
  • アマチュアサッカーチームの試合映像における重要場面の検出 : コーチングを目的として映像に付与されたコメントの利用 (画像工学)
    高橋 翔, 嶌田 聡, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 275, 280, 2012年02月20日
    電子情報通信学会, 日本語
  • 人間の動きに基づく楽曲推薦手法の実データ適用に関する検討 (画像工学)
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 281, 285, 2012年02月20日
    電子情報通信学会, 日本語
  • 犯罪捜査のための靴裏画像の類似度算出に関する検討 (画像工学)
    畠山 泰貴, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 442, 303, 306, 2012年02月20日
    電子情報通信学会, 日本語
  • Dimensionality Reduction of Sparse Visual Features via Recoverable Projection for Large-Scale Image Retrieval (ITS)
    何 再興, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 1, 6, 2012年02月20日
    電子情報通信学会, 英語
  • 数値予報における予報誤差の解析の高精度化に関する検討 (ITS)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 7, 10, 2012年02月20日
    電子情報通信学会, 日本語
  • 可視光成分と近赤外光成分が重畳された画像の色補正 : 自然画像の色成分を用いた色変換の検討 (ITS)
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 21, 25, 2012年02月20日
    電子情報通信学会, 日本語
  • 移動方向を考慮した道路映像中のシカ検出の高精度化に関する検討 (ITS)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 67, 71, 2012年02月20日
    電子情報通信学会, 日本語
  • 視聴動作から推定される関心度を用いたユーザクラスタリングに関する検討 (ITS)
    白石 哲夫, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 189, 193, 2012年02月20日
    電子情報通信学会, 日本語
  • A note on the application of Web information to near-duplicate online video detection (ITS)
    ペンコフ マイケル, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 201, 205, 2012年02月20日
    電子情報通信学会, 英語
  • アマチュアサッカーチームの試合映像における重要場面の検出 : コーチングを目的として映像に付与されたコメントの利用 (ITS)
    高橋 翔, 嶌田 聡, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 275, 280, 2012年02月20日
    電子情報通信学会, 日本語
  • 人間の動きに基づく楽曲推薦手法の実データ適用に関する検討 (ITS)
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 281, 285, 2012年02月20日
    電子情報通信学会, 日本語
  • 犯罪捜査のための靴裏画像の類似度算出に関する検討 (ITS)
    畠山 泰貴, 長谷山 美紀, 電子情報通信学会技術研究報告 : 信学技報, 111, 441, 303, 306, 2012年02月20日
    電子情報通信学会, 日本語
  • 野球映像から取得した投球動作とスコアブックに記載された情報を用いた投手のコンディションの推定に関する検討
    久保純貴, 高橋翔, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 111, 442(IE2011 105-132), 287, 292, 2012年02月13日
    日本語
  • ぶれによる劣化画像の高精度な復元に関する検討―エッジ方向を考慮した重み付けパラメータの原画像の事前確率への導入によるリンギングの抑制―
    吉崎茜, 和泉大佑, 小川貴弘, 長谷山美紀, 電子情報通信学会技術研究報告, 111, 442(IE2011 105-132), 27, 32, 2012年02月13日
    日本語
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 111, 442, 313, 317, 2012年02月13日
    日本語
  • Dimensionality Reduction of Sparse Visual Features via Recoverable Projection for Large-Scale Image Retrieval (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    何 再興, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 1, 6, 2012年02月
    映像情報メディア学会, 英語
  • 数値予報における予報誤差の解析の高精度化に関する検討 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 7, 10, 2012年02月
    映像情報メディア学会, 日本語
  • Dynamic Coalescence Modelの高速化に関する一考察 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    海田 健, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 36, 9, 11, 14, 2012年02月
    映像情報メディア学会, 日本語
  • 移動方向を考慮した道路映像中のシカ検出の高精度化に関する検討 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 67, 71, 2012年02月
    映像情報メディア学会, 日本語
  • 視聴動作から推定される関心度を用いたユーザクラスタリングに関する検討 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    白石 哲夫, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 189, 193, 2012年02月
    映像情報メディア学会, 日本語
  • A Note on the Application of Web Information to Near-Duplicate Online Video Detection (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    ペンコフ マイケル, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 201, 205, 2012年02月
    映像情報メディア学会, 英語
  • 人間の動きに基づく楽曲推薦手法の実データ適用に関する検討 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 281, 285, 2012年02月
    映像情報メディア学会, 日本語
  • 犯罪捜査のための靴裏画像の類似度算出に関する検討 (メディア工学 ヒューマンインフォメーション 映像表現&コンピュータグラフィックス)
    畠山 泰貴, 長谷山 美紀, 映像情報メディア学会技術報告, 36, 9, 303, 306, 2012年02月
    映像情報メディア学会, 日本語
  • 選手の移動速度を考慮したサッカー映像における3次元パス可能領域の推定に関する検討
    高橋翔, 長谷山美紀, 映像情報メディア学会冬季大会講演予稿集(CD-ROM), 2012, 2012年
  • An image copyright-protectionapproach without signature insertion
    Miki Haseyama, Isao Kondo, Proceedings of the 6th IASTED International Conference on Software Engineering and Applications, SEA 2002, 275, 279, 2012年01月01日
    Various watermarking algorithms have provided successful solutions for copyright protection and authentication of multimedia data. Watermarking techniques usually embed a watermark into an original host therefore the original content is altered. When authors/owners of art works desire to distribute their products in the original quality while require the copyrights to be properly protected, the watermark embedding techniques cannot satisfy such a requirement. To respond to such requirements, this paper proposes a new image copyright-protection system, which does not alter the original images at all while provides a robust and reliable authentication scheme to the protected images. The proposed system consists of a signature generation subsystem and a signature extraction subsystem. Neither of the subsystems requires any signatures to be embedded in the original images. The experimental results show that our system can survive attacks to the images and can correctly extract the signature for authentication.
  • Support vector data dscription-based method for finding new benthic species and estimating their taxonomy position from microscopic images
    Takashi Hasegawa, Takahiro Ogawa, Hidemi Watanabe, Miki Haseyama, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 66, 7, J240, J250, 2012年
    This paper presents a support vector data description (SVDD)-based method for finding new benthic species from microscopic images and its application to taxonomy position estimation. First, the proposed method generates hyperspheres that represent taxonomic species taxa of known species and enables automatic species classification. Furthermore, weight estimation of visual features based on multiple kernel learning (MKL) is used in this approach to realize automatic weighting of categorical traits that are traditionally determined by taxonomists. Next, based on the traditional taxonomic classification scheme, the proposed method merges the hyperspheres of similar species and generates new hyperspheres that represent ultra-species taxa in higher hierarchies. Then, from the obtained results, a new decision tree, whose nodes are hyperspheres of species taxa and ultra-species taxa, is constructed. By using this decision tree, new benthic species can be found from target samples, and their taxonomic positions can also be estimated., 日本語
  • Image Inpainting by Block-Based Linear Regression with Optimal Block Selection
    Akira Tanaka, Takahiro Ogawa, Miki Haseyama, 2012 ASIA-PACIFIC SIGNAL AND INFORMATION PROCESSING ASSOCIATION ANNUAL SUMMIT AND CONFERENCE (APSIPA ASC), 1, 4, 2012年
    Estimation of missing entries in a multivariate data is one of classical problems in the field of statistical science. One of most popular approaches for this problem is linear regression based on the EM algorithm. When we consider to apply this approach to block-based image inpainting problems, we have additional information, that is, a target lost pixel could be included in multiple blocks, which implies that we have multiple candidates of estimates for the pixel. In such cases, we have to choose a good estimate among the multiple candidates. In this paper, we propose a novel image inpainting method incorporating optimal block selection in terms of the expected squared errors among multiple candidates of the estimate for the target pixel. Results of numerical examples are also shown to verify the efficacy of the proposed method., IEEE, 英語
  • サッカー映像における選手位置抽出結果を用いたチーム戦術の推定に関する検討
    大貫修平, 高橋翔, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2011, ROMBUNNO.154, 2011年10月22日
    日本語
  • 楽曲特徴量に基づくクラシック楽曲の時代分類に関する考察
    松野恵一, 大串裕幸, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2011, ROMBUNNO.148, 2011年10月22日
    日本語
  • 数値予報における予報誤差の解析に関する検討
    高橋信太郎, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2011, ROMBUNNO.151, 2011年10月22日
    日本語
  • 画像検索結果の提示方法の有効性に関する一検討
    小林克希, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2011, ROMBUNNO.145, 2011年10月22日
    日本語
  • 視聴行動解析に基づく関心度の推定に関する検討
    白石哲夫, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2011, ROMBUNNO.157, 2011年10月22日
    日本語
  • 相互部分空間法を用いた音楽番組のインデキシング高精度化に関する検討
    吉田壮, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2011, ROMBUNNO.144, 2011年10月22日
    日本語
  • 8-4 選手動作と歓声の関係性に注目したサッカー映像における重要場面の検出に関する検討(第8部門メディア処理2)
    久保 純貴, 高橋 翔, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会年次大会講演予稿集, 2011, 2011, 8, 4-1-"8-4-2", 2011年08月24日
    This paper presents a detection method of important events based on relationship between player action and sound on stadium in soccer videos. Generally, since player action and sound on stadium have high correlation in the important events, we realize the detection by using their relationship based on canonical correlation analysis., 一般社団法人映像情報メディア学会, 日本語
  • 8-5 色の共起頻度を用いたサッカー映像におけるユニフォームの色成分の推定に関する検討(第8部門メディア処理2)
    高橋 翔, 長谷山 美紀, 映像情報メディア学会年次大会講演予稿集, 2011, 2011, 8, 5-1-"8-5-2", 2011年08月24日
    This paper proposes a color estimation method of team uniforms in soccer videos based on color co-occurrence. The proposed method calculates color correlograms and selects sets of color components, whose co-occurrences are higher than the other sets. This enables the color component estimation of the team uniforms, which contain multiple colors., 一般社団法人映像情報メディア学会, 日本語
  • 10-11 ぶれにより劣化した画像の復元に関する一考察 :事前確率分布の適応的なパラメータ設定の導入(第10部門画像処理2)
    吉崎 茜, 和泉 大佑, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会年次大会講演予稿集, 2011, 2011, 10, 11-1-"10-11-2", 2011年08月24日
    This paper presents a method for blurred image restoration. The proposed method adopts object matching for PSF estimation and adaptive parameter setting of a prior probability distribution for latent image estimation. Then, accurate blur removal becomes feasible without suffering from ringing artifacts., 一般社団法人映像情報メディア学会, 日本語
  • 選手動作と歓声の関係性に注目したサッカー映像における重要場面の検出に関する検討
    久保純貴, 高橋翔, 小川貴弘, 長谷山美紀, 映像情報メディア学会年次大会講演予稿集(CD-ROM), 2011, ROMBUNNO.8-4, 2011年08月01日
    日本語
  • ぶれにより劣化した画像の復元に関する一考察―事前確率分布の適応的なパラメータ設定の導入―
    吉崎茜, 和泉大佑, 小川貴弘, 長谷山美紀, 映像情報メディア学会年次大会講演予稿集(CD-ROM), 2011, ROMBUNNO.10-11, 2011年08月01日
    日本語
  • 画像特徴を用いたキーワードの階層化手法とその画像アノテーションへの応用
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 69, 72, 2011年02月14日
    本文では,画像特徴を用いたキーワードの階層化手法を提案し,その画像アノテーションへの応用について検討する.提案手法では,意味的に上位となるキーワードほど,そのキーワードの付与された画像セットにおける画像特徴のばらつきが大きくなることに着目し,以下のアプローチによりキーワードの階層化を行う.まず,あるキーワードに関する画像セットにおいて,画像特徴に基づくクラスタリングを適用する。次に,得られた結果に対し,キーワードの視覚的多様性を表す指標を導入する.具体的に,この指標は,各クラスタにおける画像特徴の分散及びクラスタ間の類似度から算出し,値を降順に並べることで,画像特徴に基づくキーワードの階層化が可能となる.得られた階層性に基づき,まず意味的に下位となるキーワードを画像特徴を用いて推定し,それらのキーワードと強い関係を持つ上位のキーワードを付与することで,画像アノテーションの高精度化が期待される., 一般社団法人映像情報メディア学会, 日本語
  • 映像特徴量を用いた Web コミュニティ抽出手法の高速化に関する検討
    畠山 泰貴, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 73, 76, 2011年02月14日
    本文では,Locality Sensitive Hashingを用いた映像特徴量に基づく高速なWebコミュニティ抽出手法を提案する.提案手法は映像から得られる画像,音響及び映像を含むWebページから得られるテキスト特徴に対し,Locality Sensitive Hashingを施すことで高速に映像間の類似度計算を可能とする.さらに,得られた映像間の類似度と映像を含むWebページのリンク関係に基づいて類似した内容の映像集合であるWebコミュニティの抽出を行う.したがって,提案手法は高速にWebコミュニティの抽出が可能となり,大規模なデータセットに対しても高速な映像検索が実現される., 一般社団法人映像情報メディア学会, 日本語
  • サッカー映像におけるパス可能領域の推定手法の高精度化に関する考察 : 適応的なパラメータ設定法の導入
    高橋 翔, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 77, 82, 2011年02月14日
    本稿では,サッカー映像においてパスが可能な領域を推定する際に用いている2つのパラメータ,選手の走行速度およびボールの速度の適応的な設定法を導入することで,より高精度なパス可能領域の推定を実現する.我々はこれまで,ボールの速度や選手の走行速度としてその平均値を用い,選手位置に基づいてパス可能領域の推定を行った.しかしながら,実際のサッカー競技においてパスが行われる場面では,試合の状況や選手の身体能力によってボールおよび選手の速度が大きく異なり,それらは攻撃および守備の選手同士の距離や密度によって変化している.よって,より高精度なパス可能領域の推定を実現するためには,ボールの速度および選手の走行速度を攻撃および守備の選手同士の距離や密度に基づいて適応的に設定する必要がある.そこで,提案手法では,サッカー映像から取得する選手位置を用いて,選手の走行速度およびボールの速度に関するパラメータの適応的な設定を行う,これにより,パス可能領域の推定手法の高精度化が実現される., 一般社団法人映像情報メディア学会, 日本語
  • 映像から取得した人間の動きと楽曲との関係に基づく楽曲推薦手法 : 自動化と高精度化のための検討
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 83, 87, 2011年02月14日
    本文では,以前に我々が提案した映像から取得される人間の動きと楽曲の関係に基づく楽曲推薦手法の高精度化と自動化について検討を行う.提案手法では,カーネル正準相関分析に基づく人間の動きと楽曲との関係のモデル化を行う際,人間が含まれる領域を予め与える必要がある.そこで,本文では,映像から得られる動き特徴に基づき,人間が撮像されている領域の自動抽出を可能とし,自動で楽曲を推薦することを可能とする.本文の最後では,映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う., 一般社団法人映像情報メディア学会, 日本語
  • 対象物検出機能を含むSVDDに基づく識別器の高精度化に関する一検討
    岡田 周史, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 113, 117, 2011年02月14日
    本文では,対象物検出機能を含むSVDDに基づく識別器の高精度化手法を提案する.提案手法では,対象物を含む学習画像からSVDDにより算出される超球の中心からの距離に基づいて,対象物を含む領域を自動で選択し,新たな学習画像を生成する.これにより,対象物の位置や向き,大きさ,形状などが多様な学習画像を用いた場合であっても,対象物を含む領域のみを新たに正例として識別器の学習に利用することが可能となる.また,選択された領域を内包する様々なサイズの局所ブロックも同時に新たな正例として利用することで,対象物を含む正例のバリエーションを増やすことが可能となる.以上により,近年の学習に基づく手法や局所特徴に基づく手法において困難であった,対象物を含む領域の自動選択,および得られる領域に基づく新たな学習画像の生成が可能となり,識別精度の向上が実現される.本文の最後では,提案手法の有効性を確認するため,実画像を用いた比較実験により性能の評価を行う., 一般社団法人映像情報メディア学会, 日本語
  • 複数の気象データを用いたフロー推定法の高精度化に関する一考察
    李 徳智, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 119, 124, 2011年02月14日
    本文では,複数の気象データを用いたフロー推定の高精度化に関する検討を行う.提案手法では,雲量のデータから三次元空間におけるフローを推定するため,二次元データを処理するための従来手法を三次元へ拡張する.さらに,風速や上昇流のデータからフロー推定の際の制約条件を新たに設定する.これにより,雲量のみを利用したフロー推定法と比較して,より高精度なフローの算出を可能とする., 一般社団法人映像情報メディア学会, 日本語
  • 顕微鏡画像中に含まれる底生生物の自動分類法 : SVDDを用いた分類の高精度化に関する検討
    長谷川 尭史, 小川 貴弘, 渡邉 日出海, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 125, 129, 2011年02月14日
    本文では,Support Vector Data Description(SVDD)を用いた顕微鏡画像中に含まれる生物の自動分類法を提案する.提案手法では,数種類の底生生物の画像を対象としてSVDDを用いた学習を行い,生成された識別器を用いて実際に撮像した顕微鏡画像中に含まれる生物の生物種分類を行う.このとき,SVDDの識別のみでは一度に多くの生物種を高精度に分類することは困難であるため,階層的な分岐処理を導入する.具体的に高精度に識別可能な生物種を順次取り除き生物種を絞り込むことで,複数の生物種を扱った場合でもより高精度な分類を行うことを可能とする., 一般社団法人映像情報メディア学会, 日本語
  • 撮像物体の対応を考慮したMCMC法に基づくシーン分割の高精度化に関する検討
    宋 妍, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 131, 135, 2011年02月14日
    本文では,撮像物体の対応を考慮したMarkov Chain Monte Carlo (MCMC)法に基づくシーン分割手法を提案する.提案手法では,映像中に含まれる対象物体の回転,スケール変化及び照明の変化に頑健なSIFT特徴量を用いて,特徴点による物体の対応付けを行い,得られるショット間の類似度に基づいて映像の構造に基づくシーン境界候補の抽出を行う.このとき,SIFTを用いることで,従来の手法で多く用いられる色ヒストグラム特徴量を用いた場合に撮像環境における対象物体の変化が大きいために発生していたシーンの過分割を抑制することが可能となる.さらに,提案手法ではMCMC法に基づいてシーン境界候補から真のシーン境界を推定する.このとき,映像の構造に注目して,シーン分割を行うことにより,従来のMCMC法を用いた手法に比べ,映像の構造を明確に持つ映像コンテンツのシーン分割が可能となる.本文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.さらに,提案手法及び従来手法で用いられる各特徴量がシーン分割に与える影響について考察を行う., 一般社団法人映像情報メディア学会, 日本語
  • ぶれにより劣化した低解像度動画像の高解像度化に関する考察 : PSFを用いた事後確率の高精度化に関する検討
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 159, 164, 2011年02月14日
    本文では,ぶれにより劣化した低解像度動画像に対して,ぶれ関数を推定し,ぶれの除去及び高解像度化を同時に行う手法を提案する.提案手法では,高解像度フレームとぶれ関数の事後確率を定義することで,最大事後確率推定を用いて,それらを同時に推定する.このとき,ぶれ関数については,輝度勾配に注目し,フレーム中から自動で選択したエッジを多く含む領域を用いて,その推定を行う.このように,ぶれ関数の推定に適した領域を用いることで,その精度の向上が期待できる.以上により,提案手法では,ぶれ関数の推定誤差により生じる再構成結果の劣化を抑制し,高精度にぶれの除去及び高解像度化を実現する., 一般社団法人映像情報メディア学会, 日本語
  • 複数種類の識別器を用いた電子レセプトデータからの傷病名推定に関する検討
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 171, 174, 2011年02月14日
    本文では,電子レセプトデータに記載されている診療情報から医療資源を最も投入した傷病名を推定する手法について提案する.提案手法では,医療資源を最も投入した傷病名が明記されているDiagnosis Procedure Combination(DPC)データを教師データとし,診療情報から算出される特徴ベクトルと医療資源を最も投入した傷病名を表すラベルの組を用いて識別器を構築する.これにより,電子レセプトデータから医療資源を最も投入した傷病名の推定が可能となる.また本文では,複数種類の識別器より得られる推定結果を併用することにより,傷病名推定の高精度化について検討する., 一般社団法人映像情報メディア学会, 日本語
  • 簡便な画像処理による交通流計測とその実データへの適用への試み
    西野 泰典, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 193, 198, 2011年02月14日
    本文では,道路監視カメラにより撮像ざれた映像から走行車両の検出を行い,その検出結果より車速計測,車種判別を行う手法を提案する.提案手法では,日照条件によって,車体またはヘッドライトの光に基づいた,車速計測,車種判別を実現する.また,薄暮時など,短時間で日照が変化する環境下での交通流計測の高精度化を行うために,検出に利用される特徴である車体またはヘッドライトの光を対象の映像より自動で選択する処理を導入する.これにより,薄暮時の映像において,輝度ヒストグラムを用いて昼夜の交通流計測手法を切り替えた場合よりも,頑健な交通流計測が期待される., 一般社団法人映像情報メディア学会, 日本語
  • 購買履歴データ解析によるユーザの嗜好の可視化に関する検討
    高谷 太紹, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 199, 202, 2011年02月14日
    本文では,購買履歴データを解析することで,複数のユーザにより構成されるユーザ集合の嗜好を分析し,それを可視化する手法を提案する.提案手法は,同時に購買された商品の組み合わせから特徴ベクトルを定義し,あらかじめユーザをプロフィールにより分類することで求めたユーザ集合を,互いに比較することでユーザ集合間の嗜好の差異を表現する.提案手法は,Bag-of-Wordsに着想を得たデータ解析を行っており,あるユーザの購買履歴データが十分に得られていない場合でも,そのユーザを含むユーザ集合の購買履歴データを利用し,ユーザ集合の嗜好を推定することが可能となる.さらに,算出されたユーザ集合の嗜好を表す特徴ベクトルに対し,多次元尺度構成法を施すことにより,その嗜好の可視化も可能とする., 一般社団法人映像情報メディア学会, 日本語
  • 回路理論による1次元格子振動の解析に関する一考察
    任 捷, 永井 信夫, 長谷山 美紀, 映像情報メディア学会技術報告, 35, 9, 203, 208, 2011年02月14日
    1次元格子振動は運動方程式で表され,その方程式は差分方程式で表される.差分方程式は回路理論を用いると,等価回路としてLC梯子形回路が得られる.ここに,Lはインダクタンスを表し,Cはキャパシタンスを表す.本文では差分方程式から得られるLC梯子形等価回路を利用して,一次元格子振動の特徴を回路解析手法を応用し,固有振動を共鳴現象の終端を開放や短絡の状態として求める., 一般社団法人映像情報メディア学会, 日本語
  • 画像特徴を用いたキーワードの階層化手法とその画像アノテーションへの応用
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 69, 72, 2011年02月14日
    本文では,画像特徴を用いたキーワードの階層化手法を提案し,その画像アノテーションへの応用について検討する.提案手法では,意味的に上位となるキーワードほど,そのキーワードの付与された画像セットにおける画像特徴のばらつきが大きくなることに着目し,以下のアプローチによりキーワードの階層化を行う.まず,あるキーワードに関する画像セットにおいて,画像特徴に基づくクラスタリングを適用する。次に,得られた結果に対し,キーワードの視覚的多様性を表す指標を導入する.具体的に,この指標は,各クラスタにおける画像特徴の分散及びクラスタ間の類似度から算出し,値を降順に並べることで,画像特徴に基づくキーワードの階層化が可能となる.得られた階層性に基づき,まず意味的に下位となるキーワードを画像特徴を用いて推定し,それらのキーワードと強い関係を持つ上位のキーワードを付与することで,画像アノテーションの高精度化が期待される., 一般社団法人電子情報通信学会, 日本語
  • 映像特徴量を用いた Web コミュニティ抽出手法の高速化に関する検討
    畠山 泰貴, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 73, 76, 2011年02月14日
    本文では,Locality Sensitive Hashingを用いた映像特徴量に基づく高速なWebコミュニティ抽出手法を提案する.提案手法は映像から得られる画像,音響及び映像を含むWebページから得られるテキスト特徴に対し,Locality Sensitive Hashingを施すことで高速に映像間の類似度計算を可能とする.さらに,得られた映像問の類似度と映像を含むWebページのリンク関係に基づいて類似した内容の映像集合であるWebコミュニティの抽出を行う.したがって,提案手法は高速にWebコミュニティの抽出が可能となり,大規模なデータセットに対しても高速な映像検索が実現される., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるパス可能領域の推定手法の高精度化に関する考察 : 適応的なパラメータ設定法の導入
    高橋 翔, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 77, 82, 2011年02月14日
    本稿では,サッカー映像においてパスが可能な領域を推定する際に用いている2つのパラメータ,選手の走行速度およびボールの速度の適応的な設定法を導入することで,より高精度なパス可能領域の推定を実現する.我々はこれまで,ボールの速度や選手の走行速度としてその平均値を用い,選手位置に基づいてパス可能領域の推定を行った.しかしながら,実際のサッカー競技においてパスが行われる場面では,試合の状況や選手の身体能力によってボールおよび選手の速度が大きく異なり,それらは攻撃および守備の選手同士の距離や密度によって変化している.よって,より高精度なパス可能領域の推定を実現するためには,ボールの速度および選手の走行速度を攻撃および守備の選手同士の距離や密度に基づいて適応的に設定する必要がある。そこで,提案手法では,サッカー映像から取得する選手位置を用いて,選手の走行速度およびボールの速度に関するパラメータの適応的な設定を行う.これにより,パス可能領域の推定手法の高精度化が実現される., 一般社団法人電子情報通信学会, 日本語
  • 映像から取得した人間の動きと楽曲との関係に基づく楽曲推薦手法自動化と高精度化のための検討
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 83, 87, 2011年02月14日
    本文では,以前に我々が提案した映像から取得される人間の動きと楽曲の関係に基づく楽曲推薦手法の高精度化と自動化について検討を行う.提案手法では,カーネル正準相関分析に基づく人間の動きと楽曲との関係のモデル化を行う際人間が含まれる領域を予め与える必要がある.そこで,本文では,映像から得られる動き特徴に基づき,人間が撮像されている領域の自動抽出を可能とし,自動で楽曲を推薦することを可能とする.本文の最後では,映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う., 一般社団法人電子情報通信学会, 日本語
  • 対象物検出機能を含むSVDDに基づく識別器の高精度化に関する一検討
    岡田 周史, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 113, 117, 2011年02月14日
    本文では,対象物検出機能を含むSVDDに基づく識別器の高精度化手法を提案する.提案手法では,対象物を含む学習画像からSVDDにより算出される超球の中心からの距離に基づいて,対象物を含む領域を自動で選択し,新たな学習画像を生成する.これにより,対象物の位置や向き,大きさ,形状などが多様な学習画像を用いた場合であっても,対象物を含む領域のみを新たに正例として識別器の学習に利用することが可能となる.また,選択された領域を内包する様々なサイズの局所ブロックも同時に新たな正例として利用することで,対象物を含む正例のバリエーションを増やすことが可能となる.以上により,近年の学習に基づく手法や局所特徴に基づく手法において困難であった,対象物を含む領域の自動選択,および得られる領域に基づく新たな学習画像の生成が可能となり,識別精度の向上が実現される.本文の最後では,提案手法の有効性を確認するため,実画像を用いた比較実験により性能の評価を行う., 一般社団法人電子情報通信学会, 日本語
  • 複数の気象データを用いたフロー推定法の高精度化に関する一考察
    李 徳智, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 119, 124, 2011年02月14日
    本文では,複数の気象データを用いたフロー推定の高精度化に関する検討を行う.提案手法では,雲量のデータから三次元空間におけるフローを推定するため,二次元データを処理するための従来手法を三次元へ拡張する.さらに,風速や上昇流のデータからフロー推定の際の制約条件を新たに設定する.これにより,雲量のみを利用したフロー推定法と比較して,より高精度なフローの算出を可能とする., 一般社団法人電子情報通信学会, 日本語
  • 顕微鏡画像中に含まれる底生生物の自動分類法 : SVDDを用いた分類の高精度化に関する検討
    長谷川 尭史, 小川 貴弘, 渡邉 日出海, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 125, 129, 2011年02月14日
    本文では,Support Vector Data Description(SVDD)を用いた顕微鏡画像中に含まれる生物の自動分類法を提案する.提案手法では,数種類の底生生物の画像を対象としてSVDDを用いた学習を行い,生成された識別器を用いて実際に撮像した顕微鏡画像中に含まれる生物の生物種分類を行う.このとき,SVDDの識別のみでは一度に多くの生物種を高精度に分類することは困難であるため,階層的な分岐処理を導入する.具体的に高精度に識別可能な生物種を順次取り除き生物種を絞り込むことで,複数の生物種を扱った場合でもより高精度な分類を行うことを可能とする., 一般社団法人電子情報通信学会, 日本語
  • 撮像物体の対応を考慮したMCMC法に基づくシーン分割の高精度化に関する検討
    宋 妍, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 131, 135, 2011年02月14日
    本文では,撮像物体の対応を考慮したMarkov Chain Monte Carlo(MCMC)法に基づくシーン分割手法を提案する.提案手法では,映像中に含まれる対象物体の回転,スケール変化及び照明の変化に頑健なSIFT特徴量を用いて,特徴点による物体の対応付けを行い,得られるショット間の類似度に基づいて映像の構造に基づくシーン境界候補の抽出を行う.このとき,SIFTを用いることで,従来の手法で多く用いられる色ヒストグラム特徴量を用いた場合に撮像環境における対象物体の変化が大きいために発生していたシーンの過分割を抑制することが可能となる.さらに,提案手法ではMCMC法に基づいてシーン境界候補から真のシーン境界を推定する.このとき,映像の構造に注目して,シーン分割を行うことにより,従来のMCMC法を用いた手法に比べ,映像の構造を明確に持つ映像コンテンツのシーン分割が可能となる.本文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.さらに,提案手法及び従来手法で用いられる各特徴量がシーン分割に与える影響について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • ぶれにより劣化した低解像度動画像の高解像度化に関する考察 : PSFを用いた事後確率の高精度化に関する検討
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 159, 164, 2011年02月14日
    本文では,ぶれにより劣化した低解像度動画像に対して,ぶれ関数を推定し,ぶれの除去及び高解像度化を同時に行う手法を提案する.提案手法では,高解像度フレームとぶれ関数の事後確率を定義することで,最大事後確率推定を用いて,それらを同時に推定する.このとき,ぶれ関数については,輝度勾配に注目し,フレーム中から自動で選択したエッジを多く含む領域を用いて,その推定を行う.このように,ぶれ関数の推定に適した領域を用いることで,その精度の向上が期待できる.以上により,提案手法では,ぶれ関数の推定誤差により生じる再構成結果の劣化を抑制し,高精度にぶれの除去及び高解像度化を実現する., 一般社団法人電子情報通信学会, 日本語
  • 複数種類の識別器を用いた電子レセプトデータからの傷病名推定に関する検討
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 171, 174, 2011年02月14日
    本文では,電子レセプトデータに記載されている診療情報から医療資源を最も投入した傷病名を推定する手法について提案する.提案手法では,医療資源を最も投入した傷病名が明記されているDiagnosis Procedure Combination(DPC)データを教師データとし,診療情報から算出される特徴ベクトルと医療資源を最も投入した傷病名を表すラベルの組を用いて識別器を構築する.これにより,電子レセプトデータから医療資源を最も投入した傷病名の推定が可能となる.また本文では,複数種類の識別器より得られる推定結果を併用することにより,傷病名推定の高精度化について検討する., 一般社団法人電子情報通信学会, 日本語
  • 簡便な画像処理による交通流計測とその実データへの適用への試み
    西野 泰典, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 193, 198, 2011年02月14日
    本文では,道路監視カメラにより撮像された映像から走行車両の検出を行い,その検出結果より車速計測,車種判別を行う手法を提案する.提案手法では,日照条件によって,車体またはヘッドライトの光に基づいた,車速計測,車種判別を実現する.また,薄暮時など,短時間で日照が変化する環境下での交通流計測の高精度化を行うために,検出に利用される特徴である車体またはヘッドライトの光を対象の映像より自動で選択する処理を導入する.これにより,薄暮時の映像において,輝度ヒストグラムを用いて昼夜の交通流計測手法を切り替えた場合よりも,頑健な交通流計測が期待される., 一般社団法人電子情報通信学会, 日本語
  • 購買履歴データ解析によるユーザの嗜好の可視化に関する検討
    高谷 太紹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 199, 202, 2011年02月14日
    本文では,購買履歴データを解析することで,複数のユーザにより構成されるユーザ集合の嗜好を分析し,それを可視化する手法を提案する.提案手法は,同時に購買された商品の組み合わせから特徴ベクトルを定義し,あらかじめユーザをプロフィールにより分類することで求めたユーザ集合を,互いに比較することでユーザ集合間の嗜好の差異を表現する.提案手法は,Bag-oLWbrdsに着想を得たデータ解析を行っており,あるユーザの購買履歴データが十分に得られていない場合でも,そのユーザを含むユーザ集合の購買履歴データを利用し,ユーザ集合の嗜好を推定することが可能となる.さらに,算出されたユーザ集合の嗜好を表す特徴ベクトルに対し,多次元尺度構成法を施すことにより,その嗜好の可視化も可能とする., 一般社団法人電子情報通信学会, 日本語
  • 回路理論による1次元格子振動の解析に関する一考察
    任 捷, 永井 信夫, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 110, 420, 203, 208, 2011年02月14日
    1次元格子振動は運動方程式で表され,その方程式は差分方程式で表される.差分方程式は回路理論を用いると,等価回路としてLC梯子形回路が得られる.ここに,Lはインダクタンスを表し,Cはキャパシタンスを表す.本文では差分方程式から得られるLC梯子形等価回路を利用して,一次元格子振動の特徴を回路解析手法を応用し,固有振動を共鳴現象の終端を開放や短絡の状態として求める., 一般社団法人電子情報通信学会, 日本語
  • 画像特徴を用いたキーワードの階層化手法とその画像アノテーションへの応用
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 69, 72, 2011年02月14日
    本文では,画像特徴を用いたキーワードの階層化手法を提案し,その画像アノテーションへの応用について検討する.提案手法では,意味的に上位となるキーワードほど,そのキーワードの付与された画像セットにおける画像特徴のばらつきが大きくなることに着目し,以下のアプローチによりキーワードの階層化を行う.まず,あるキーワードに関する画像セットにおいて,画像特徴に基づくクラスタリングを適用する。次に,得られた結果に対し,キーワードの視覚的多様性を表す指標を導入する.具体的に,この指標は,各クラスタにおける画像特徴の分散及びクラスタ間の類似度から算出し,値を降順に並べることで,画像特徴に基づくキーワードの階層化が可能となる.得られた階層性に基づき,まず意味的に下位となるキーワードを画像特徴を用いて推定し,それらのキーワードと強い関係を持つ上位のキーワードを付与することで,画像アノテーションの高精度化が期待される., 一般社団法人電子情報通信学会, 日本語
  • 映像特徴量を用いた Web コミュニティ抽出手法の高速化に関する検討
    畠山 泰貴, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 73, 76, 2011年02月14日
    本文では,Locality Sensitive Hashingを用いた映像特徴量に基づく高速なWebコミュニティ抽出手法を提案する.提案手法は映像から得られる画像,音響及び映像を含むWebページから得られるテキスト特徴に対し,Locality Sensitive Hashingを施すことで高速に映像間の類似度計算を可能とする.さらに,得られた映像問の類似度と映像を含むWebページのリンク関係に基づいて類似した内容の映像集合であるWebコミュニティの抽出を行う.したがって,提案手法は高速にWebコミュニティの抽出が可能となり,大規模なデータセットに対しても高速な映像検索が実現される., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるパス可能領域の推定手法の高精度化に関する考察 : 適応的なパラメータ設定法の導入
    高橋 翔, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 77, 82, 2011年02月14日
    本稿では,サッカー映像においてパスが可能な領域を推定する際に用いている2つのパラメータ,選手の走行速度およびボールの速度の適応的な設定法を導入することで,より高精度なパス可能領域の推定を実現する.我々はこれまで,ボールの速度や選手の走行速度としてその平均値を用い,選手位置に基づいてパス可能領域の推定を行った.しかしながら,実際のサッカー競技においてパスが行われる場面では,試合の状況や選手の身体能力によってボールおよび選手の速度が大きく異なり,それらは攻撃および守備の選手同士の距離や密度によって変化している.よって,より高精度なパス可能領域の推定を実現するためには,ボールの速度および選手の走行速度を攻撃および守備の選手同士の距離や密度に基づいて適応的に設定する必要がある。そこで,提案手法では,サッカー映像から取得する選手位置を用いて,選手の走行速度およびボールの速度に関するパラメータの適応的な設定を行う.これにより,パス可能領域の推定手法の高精度化が実現される., 一般社団法人電子情報通信学会, 日本語
  • 映像から取得した人間の動きと楽曲との関係に基づく楽曲推薦手法自動化と高精度化のための検討
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 83, 87, 2011年02月14日
    本文では,以前に我々が提案した映像から取得される人間の動きと楽曲の関係に基づく楽曲推薦手法の高精度化と自動化について検討を行う.提案手法では,カーネル正準相関分析に基づく人間の動きと楽曲との関係のモデル化を行う際人間が含まれる領域を予め与える必要がある.そこで,本文では,映像から得られる動き特徴に基づき,人間が撮像されている領域の自動抽出を可能とし,自動で楽曲を推薦することを可能とする.本文の最後では,映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う., 一般社団法人電子情報通信学会, 日本語
  • 対象物検出機能を含むSVDDに基づく識別器の高精度化に関する一検討
    岡田 周史, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 113, 117, 2011年02月14日
    本文では,対象物検出機能を含むSVDDに基づく識別器の高精度化手法を提案する.提案手法では,対象物を含む学習画像からSVDDにより算出される超球の中心からの距離に基づいて,対象物を含む領域を自動で選択し,新たな学習画像を生成する.これにより,対象物の位置や向き,大きさ,形状などが多様な学習画像を用いた場合であっても,対象物を含む領域のみを新たに正例として識別器の学習に利用することが可能となる.また,選択された領域を内包する様々なサイズの局所ブロックも同時に新たな正例として利用することで,対象物を含む正例のバリエーションを増やすことが可能となる.以上により,近年の学習に基づく手法や局所特徴に基づく手法において困難であった,対象物を含む領域の自動選択,および得られる領域に基づく新たな学習画像の生成が可能となり,識別精度の向上が実現される.本文の最後では,提案手法の有効性を確認するため,実画像を用いた比較実験により性能の評価を行う., 一般社団法人電子情報通信学会, 日本語
  • 複数の気象データを用いたフロー推定法の高精度化に関する一考察
    李 徳智, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 119, 124, 2011年02月14日
    本文では,複数の気象データを用いたフロー推定の高精度化に関する検討を行う.提案手法では,雲量のデータから三次元空間におけるフローを推定するため,二次元データを処理するための従来手法を三次元へ拡張する.さらに,風速や上昇流のデータからフロー推定の際の制約条件を新たに設定する.これにより,雲量のみを利用したフロー推定法と比較して,より高精度なフローの算出を可能とする., 一般社団法人電子情報通信学会, 日本語
  • 顕微鏡画像中に含まれる底生生物の自動分類法 : SVDDを用いた分類の高精度化に関する検討
    長谷川 尭史, 小川 貴弘, 渡邉 日出海, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 125, 129, 2011年02月14日
    本文では,Support Vector Data Description(SVDD)を用いた顕微鏡画像中に含まれる生物の自動分類法を提案する.提案手法では,数種類の底生生物の画像を対象としてSVDDを用いた学習を行い,生成された識別器を用いて実際に撮像した顕微鏡画像中に含まれる生物の生物種分類を行う.このとき,SVDDの識別のみでは一度に多くの生物種を高精度に分類することは困難であるため,階層的な分岐処理を導入する.具体的に高精度に識別可能な生物種を順次取り除き生物種を絞り込むことで,複数の生物種を扱った場合でもより高精度な分類を行うことを可能とする., 一般社団法人電子情報通信学会, 日本語
  • 撮像物体の対応を考慮したMCMC法に基づくシーン分割の高精度化に関する検討
    宋 妍, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 131, 135, 2011年02月14日
    本文では,撮像物体の対応を考慮したMarkov Chain Monte Carlo(MCMC)法に基づくシーン分割手法を提案する.提案手法では,映像中に含まれる対象物体の回転,スケール変化及び照明の変化に頑健なSIFT特徴量を用いて,特徴点による物体の対応付けを行い,得られるショット間の類似度に基づいて映像の構造に基づくシーン境界候補の抽出を行う.このとき,SIFTを用いることで,従来の手法で多く用いられる色ヒストグラム特徴量を用いた場合に撮像環境における対象物体の変化が大きいために発生していたシーンの過分割を抑制することが可能となる.さらに,提案手法ではMCMC法に基づいてシーン境界候補から真のシーン境界を推定する.このとき,映像の構造に注目して,シーン分割を行うことにより,従来のMCMC法を用いた手法に比べ,映像の構造を明確に持つ映像コンテンツのシーン分割が可能となる.本文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.さらに,提案手法及び従来手法で用いられる各特徴量がシーン分割に与える影響について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • ぶれにより劣化した低解像度動画像の高解像度化に関する考察 : PSFを用いた事後確率の高精度化に関する検討
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 159, 164, 2011年02月14日
    本文では,ぶれにより劣化した低解像度動画像に対して,ぶれ関数を推定し,ぶれの除去及び高解像度化を同時に行う手法を提案する.提案手法では,高解像度フレームとぶれ関数の事後確率を定義することで,最大事後確率推定を用いて,それらを同時に推定する.このとき,ぶれ関数については,輝度勾配に注目し,フレーム中から自動で選択したエッジを多く含む領域を用いて,その推定を行う.このように,ぶれ関数の推定に適した領域を用いることで,その精度の向上が期待できる.以上により,提案手法では,ぶれ関数の推定誤差により生じる再構成結果の劣化を抑制し,高精度にぶれの除去及び高解像度化を実現する., 一般社団法人電子情報通信学会, 日本語
  • 複数種類の識別器を用いた電子レセプトデータからの傷病名推定に関する検討
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 171, 174, 2011年02月14日
    本文では,電子レセプトデータに記載されている診療情報から医療資源を最も投入した傷病名を推定する手法について提案する.提案手法では,医療資源を最も投入した傷病名が明記されているDiagnosis Procedure Combination(DPC)データを教師データとし,診療情報から算出される特徴ベクトルと医療資源を最も投入した傷病名を表すラベルの組を用いて識別器を構築する.これにより,電子レセプトデータから医療資源を最も投入した傷病名の推定が可能となる.また本文では,複数種類の識別器より得られる推定結果を併用することにより,傷病名推定の高精度化について検討する., 一般社団法人電子情報通信学会, 日本語
  • 簡便な画像処理による交通流計測とその実データへの適用への試み
    西野 泰典, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 193, 198, 2011年02月14日
    本文では,道路監視カメラにより撮像された映像から走行車両の検出を行い,その検出結果より車速計測,車種判別を行う手法を提案する.提案手法では,日照条件によって,車体またはヘッドライトの光に基づいた,車速計測,車種判別を実現する.また,薄暮時など,短時間で日照が変化する環境下での交通流計測の高精度化を行うために,検出に利用される特徴である車体またはヘッドライトの光を対象の映像より自動で選択する処理を導入する.これにより,薄暮時の映像において,輝度ヒストグラムを用いて昼夜の交通流計測手法を切り替えた場合よりも,頑健な交通流計測が期待される., 一般社団法人電子情報通信学会, 日本語
  • 購買履歴データ解析によるユーザの嗜好の可視化に関する検討
    高谷 太紹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 199, 202, 2011年02月14日
    本文では,購買履歴データを解析することで,複数のユーザにより構成されるユーザ集合の嗜好を分析し,それを可視化する手法を提案する.提案手法は,同時に購買された商品の組み合わせから特徴ベクトルを定義し,あらかじめユーザをプロフィールにより分類することで求めたユーザ集合を,互いに比較することでユーザ集合間の嗜好の差異を表現する.提案手法は,Bag-oLWbrdsに着想を得たデータ解析を行っており,あるユーザの購買履歴データが十分に得られていない場合でも,そのユーザを含むユーザ集合の購買履歴データを利用し,ユーザ集合の嗜好を推定することが可能となる.さらに,算出されたユーザ集合の嗜好を表す特徴ベクトルに対し,多次元尺度構成法を施すことにより,その嗜好の可視化も可能とする., 一般社団法人電子情報通信学会, 日本語
  • 回路理論による1次元格子振動の解析に関する一考察
    任 捷, 永井 信夫, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 110, 421, 203, 208, 2011年02月14日
    1次元格子振動は運動方程式で表され,その方程式は差分方程式で表される.差分方程式は回路理論を用いると,等価回路としてLC梯子形回路が得られる.ここに,Lはインダクタンスを表し,Cはキャパシタンスを表す.本文では差分方程式から得られるLC梯子形等価回路を利用して,一次元格子振動の特徴を回路解析手法を応用し,固有振動を共鳴現象の終端を開放や短絡の状態として求める., 一般社団法人電子情報通信学会, 日本語
  • Missing Intensity Interpolation Using a Kernel PCA-Based POCS Algorithm and its Applications
    Takahiro Ogawa, Miki Haseyama, IEEE TRANSACTIONS ON IMAGE PROCESSING, 20, 2, 417, 432, 2011年02月
    A missing intensity interpolation method using a kernel principal component analysis (PCA)-based projection onto convex sets (POCS) algorithm and its applications are presented in this paper. In order to interpolate missing intensities within a target image, the proposed method reconstructs local textures containing the missing pixels by using the POCS algorithm. In this reconstruction process, a nonlinear eigenspace is constructed from each kind of texture, and the optimal subspace for the target local texture is introduced into the constraint of the POCS algorithm. In the proposed method, the optimal subspace can be selected by monitoring errors converged in the reconstruction process. This approach provides a solution to the problem in conventional methods of not being able to effectively perform adaptive reconstruction of the target textures due to missing intensities, and successful interpolation of the missing intensities by the proposed method can be realized. Furthermore, since our method can restore any images including arbitrary-shaped missing areas, its potential in two image reconstruction tasks, image enlargement and missing area restoration, is also shown in this paper., IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 英語
  • 色の共起頻度を用いたサッカー映像におけるユニフォームの色成分の推定に関する検討
    高橋翔, 長谷山美紀, 映像情報メディア学会年次大会講演予稿集(CD-ROM), 2011, 2011年
  • 画像・映像処理の基礎と検索の最先端
    長谷山美紀, 映像情報メディア学会冬季大会講演予稿集(CD-ROM), 2011, 2011年
  • Human-Centric Navigation System Video Vortex for Video Retrieval
    Miki Haseyama, Takahiro Ogawa, IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS (ICCE 2011), 167, 168, 2011年
    This paper presents a human-centric navigation system "Video Vortex" for video retrieval. This system is realized by the following functions: (i) Collaborative use of multimedia data for their multi-modal analysis, (ii) Preference extraction for the system to adapt to users' individual demands, and (iii) Adaptive visualization for users to be guided to their desired contents. These functions effectively provide a solution to the conventional problems of not being able to satisfy various users' demands, and successful video retrieval becomes feasible., IEEE, 英語
  • 足跡を用いた男女識別--足跡の特徴量からSVMにより男女を識別する試み
    浅水 仁, 長谷山 美紀, 画像ラボ, 22, 1, 17, 21, 2011年01月
    日本工業出版, 日本語
  • AI-1-1 メディア横断型理論の構築と検索への応用(AI-1.マルチモーダル信号処理とその応用,依頼シンポジウム,ソサイエティ企画)
    長谷山 美紀, 電子情報通信学会ソサイエティ大会講演論文集, 2010, "SS, 68"-"SS-69", 2010年08月31日
    一般社団法人電子情報通信学会, 日本語
  • カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report, 110, 88, 63, 68, 2010年06月14日
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との間の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う., 一般社団法人電子情報通信学会, 日本語
  • 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report, 110, 88, 105, 108, 2010年06月14日
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード間の関係を導入することで,画像アノテーションの高精度化を実現する., 一般社団法人電子情報通信学会, 日本語
  • ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report, 110, 88, 109, 114, 2010年06月14日
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる., 一般社団法人電子情報通信学会, 日本語
  • 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討
    宋 妍, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理 : IEICE technical report, 110, 88, 115, 120, 2010年06月14日
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo (MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 110, 86, 63, 68, 2010年06月14日
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との問の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う., 一般社団法人電子情報通信学会, 日本語
  • 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 110, 86, 105, 108, 2010年06月14日
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード問の関係を導入することで,画像アノテーションの高精度化を実現する., 一般社団法人電子情報通信学会, 日本語
  • ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 110, 86, 109, 114, 2010年06月14日
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる., 一般社団法人電子情報通信学会, 日本語
  • 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討
    宋 妍, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 110, 86, 115, 120, 2010年06月14日
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo(MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討
    大串 裕幸, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CST, コンカレント工学, 110, 89, 63, 68, 2010年06月14日
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との間の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う., 一般社団法人電子情報通信学会, 日本語
  • 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CST, コンカレント工学, 110, 89, 105, 108, 2010年06月14日
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード間の関係を導入することで,画像アノテーションの高精度化を実現する., 一般社団法人電子情報通信学会, 日本語
  • ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定
    和泉 大佑, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CST, コンカレント工学, 110, 89, 109, 114, 2010年06月14日
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる., 一般社団法人電子情報通信学会, 日本語
  • 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討
    宋 妍, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CST, コンカレント工学, 110, 89, 115, 120, 2010年06月14日
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo (MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • SVMによる足跡を用いた男女識別に関する検討
    浅水 仁, 長谷山 美紀, 全国大会講演論文集, 72, 0, 5, 6, 2010年03月08日
    日本語
  • 3次元モデルによるパラメトリック固有空間法を用いた多関節物体の姿勢推定の高度化に関する検討
    角野 公亮, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 1, 4, 2010年02月15日
    本文では,パラメトリック固有空間法を用いて2次元の画像中に存在する多関節物体の姿勢を推定する手法を提案する.提案手法では,多関節物体の3次元モデルから様々な姿勢でのシルエット画像を生成し,それらの画素値をデータとして固有ベクトルを求め,固有空間を得る.次に,各シルエット画像を固有空間上の点に投影し,点の補間を行うことで,姿勢の連続的な変化を表す多様体を構成する.さらに,入力画像に撮像された姿勢推定対象の多関節物体のシルエット画像を固有空間に投影し,多様体上の点との距離を観察することで,最適なパラメータを推定する.このとき,多関節物体を木構造とみなし,根元から末端に向かって段階的にパラメータの最適解を求める事で,計算コストを削減した姿勢推定を実現する., 一般社団法人映像情報メディア学会, 日本語
  • バレーボール映像における選手及びボールの追跡とそのイベント推定への応用
    高橋 茂樹, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 17, 21, 2010年02月15日
    本文では,バレーボール映像における新たなボール追跡手法を提案し,レシーブやトス等の試合中のイベント推定への応用について検討を行なう.提案するボール追跡手法では,まず,バレーボール映像中において選手間でボールが放物運動を行なう点に着目し,追跡された選手位置に基づいたボールの軌跡を求める.次に,提案手法は,得られたボールの軌跡を用いることで,その追跡と共にイベント推定において重要となるボールに接触した選手とその時刻の取得を可能とする.さらに,我々は,バレーボールのルールに基づいて,提案手法をイベント推定へ応用する方法について検討を行なう.本文の最後では,実際のバレーボール映像を用いた実験を行い,提案手法の有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • 群化の性質に基づいた連想型映像検索の定量評価に関する検討
    徳本 了太, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 119, 122, 2010年02月15日
    本稿では,ゲシュタルト心理学における群化の性質に基づき,連想型映像検索結果を定量的に評価する評価値を提案する.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する連想型映像検索システムを提案した.しかしながら,この手法では検索結果の定量的評価に至ることができなかった.そこで,本稿では,連想型映像検索結果を評価するためのモデルを定義する.そのモデルにおいて形成される映像の群を群化とし,その程度を表す定量値を算出する.さらに,定量値を用いて連想型映像検索結果の有効性を評価するための評価値を定義する.その評価値の大小を比較することで,連想型映像検索結果の定量的な評価が可能となる., 一般社団法人映像情報メディア学会, 日本語
  • PLSAを用いた映像の構造解析に基づくシーン分割手法の高精度化 : Sequence Alignment の導入による新たな類似度の定義
    山本 誠, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 123, 128, 2010年02月15日
    本文では,映像中に存在する連続した複数のショットに注目した構造解析に基づき,高精度なシーン分割を可能とする手法を提案する.提案手法では,Sequence Alignmentの一手法であるDynamic Time Warping(DTW)により複数ショット間において伸縮を許容した類似度の算出を可能とし,これを用いることで構造解析を行う.このとき,映像中のショットから得られる特徴量に対してProbabilistic Latent Semantic Analysis(PLSA)を適用し,得られる結果を用いて新たにDTWのコストを定義する.以上により,複数ショットの類似性に注目した高度な構造解析が可能となり,提案手法では高精度なシーン分割が実現される., 一般社団法人映像情報メディア学会, 日本語
  • Web コミュニティ抽出に基づく映像検索手法の高精度化に関する検討 : 映像の類似性に注目したクラスタリング手法の導入
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 129, 132, 2010年02月15日
    本文では,映像の類似性に注目したクラスタリング手法を導入したWebコミュニティ抽出に基づく高精度な検索手法を提案する.提案手法では,映像及びその映像を含むWebページから得られる特徴の類似性に基づき,重み付けを行ったリンク関係にリンク解析を施し,類似した映像を含むWebページの集合であるWebコミュニティを抽出する.さらに,抽出されたWebコミュニティ内に含まれる映像の類似性に基づいてクラスタリングを行う.これにより,ユーザはWebコミュニティから得られた類似した特徴の映像を含むクラスタを用いて効果的に検索することが可能となる.したがって,提案手法は類似した内容と特徴を持つ映像の効果的な検索を実現する., 一般社団法人映像情報メディア学会, 日本語
  • 個人の嗜好に基づいた楽曲の推薦に関する一検討 : 嗜好に関するモデルの類似性を表す指標の導入
    小林 和也, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 171, 174, 2010年02月15日
    本文では,個人の嗜好の類似性に注目した新たな楽曲推薦手法を提案する.提案手法ではまず,ユーザ毎に好みに関する評価が行われている楽曲を教師データとし,それらから算出される特徴ベクトルに対してSupport Vector Data Description(SVDD)を適用することで,好みの楽曲を識別する超球をユーザ毎に算出する.ここで,提案手法ではユーザ間における嗜好の類似性を表す指標を新たに定義し,この指標に基づいて嗜好の類似するユーザの組み合わせを選択する.次に,提案手法では推薦対象ユーザに対する超球の中心とテストデータとして与えられるデータベース内の特徴ベクトルとの距離に基づいて算出される確率,及び選択された嗜好の類似するユーザの超球を用いて同様に算出される確率に基づいて,推薦結果を出力する.その結果,提案手法はユーザ間における嗜好の類似性に注目した高精度な楽曲推薦が期待できる., 一般社団法人映像情報メディア学会, 日本語
  • 道路監視カメラ映像の交通流計測に関する一考察 : 撮影環境の変化による精度低下の抑制に関する検討
    村山 聖太, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 175, 178, 2010年02月15日
    本文では,道路監視カメラにより撮影された映像に対して,撮影環境の変化による精度低下を抑制した交通流の計測を行う手法を提案する.提案手法では,車線内を走行する車両を,車体やヘッドライトの濃度値に基づいて検出する.その際,車両領域の存在および通過を判定するために用いるパラメータは,天候の変化に伴う照度変化に合わせて適切に設定する必要がある.そこで,提案手法では,照度と関連が強い画像特徴を用いて,重回帰分析によりパラメータを推定する.これにより,撮影環境が異なる映像においても,適用可能となるようにパラメータが設定され,高精度な交通流計測が期待される., 一般社団法人映像情報メディア学会, 日本語
  • アクティブグリッドを用いたサッカー映像における3次元パス可能領域の推定に関する一考察
    高橋 翔, 長谷山 美紀, 映像情報メディア学会技術報告, 34, 6, 185, 190, 2010年02月15日
    本稿では,アクティブグリッドを用いてサッカー映像からパスが可能な3次元領域を推定する手法を提案する.これまで,我々はサッカーフィールド上に推定されるボールの位置や選手位置を用い,パス可能領域をサッカーフィールド上に2次元の領域として推定した.しかしながら,パスコースは3次元空間上に存在するため,より高精度にパス可能領域を推定するためには3次元の領域として推定する必要がある.そこで,提案手法では,選手とボールの位置を用いて選手が移動可能な3次元空間を定式化し,3次元のボリュームデータを生成することで,領域抽出手法であるアクティブグリッドの適用を可能とする.これにより,アクティブグリッドを用いた3次元のパス可能領域推定が実現される., 一般社団法人映像情報メディア学会, 日本語
  • 3次元モデルによるパラメトリック固有空間法を用いた多関節物体の姿勢推定の高度化に関する検討
    角野 公亮, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 1, 4, 2010年02月08日
    本文では,パラメトリック固有空間法を用いて2次元の画像中に存在する多関節物体の姿勢を推定する手法を提案する.提案手法では,多関節物体の3次元モデルから様々な姿勢でのシルエット画像を生成し,それらの画素値をデータとして固有ベクトルを求め,固有空間を得る.次に,各シルエット画像を固有空間上の点に投影し,点の補間を行うことで,姿勢の連続的な変化を表す多様体を構成する.さらに,入力画像に撮像された姿勢推定対象の多関節物体のシルエット画像を固有空間に投影し,多様体上の点との距離を観察することで,最適なパラメータを推定する.このとき,多関節物体を木構造とみなし,根元から末端に向かって段階的にパラメータの最適解を求める事で,計算コストを削減した姿勢推定を実現する., 一般社団法人電子情報通信学会, 日本語
  • バレーボール映像における選手及びボールの追跡とそのイベント推定への応用
    高橋 茂樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 17, 21, 2010年02月08日
    本文では,バレーボール映像における新たなボール追跡手法を提案し,レシーブやトス等の試合中のイベント推定への応用について検討を行なう.提案するボール追跡手法では,まず,バレーボール映像中において選手間でボールが放物運動を行なう点に着目し,追跡された選手位置に基づいたボールの軌跡を求める.次に,提案手法は,得られたボールの軌跡を用いることで,その追跡と共にイベント推定において重要となるボールに接触した選手とその時刻の取得を可能とする.さらに,我々は,バレーボールのルールに基づいて,提案手法をイベント推定へ応用する方法について検討を行なう.本文の最後では,実際のバレーボール映像を用いた実験を行い,提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 群化の性質に基づいた連想型映像検索の定量評価に関する検討
    徳本 了太, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 119, 122, 2010年02月08日
    本稿では,ゲシュタルト心理学における群化の性質に基づき,連想型映像検索結果を定量的に評価する評価値を提案する.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する連想型映像検索システムを提案した.しかしながら,この手法では検索結果の定量的評価に至ることができなかった.そこで,本稿では,連想型映像検索結果を評価するためのモデルを定義する.そのモデルにおいて形成される映像の群を群化とし,その程度を表す定量値を算出する.さらに,定量値を用いて連想型映像検索結果の有効性を評価するための評価値を定義する.その評価値の大小を比較することで,連想型映像検索結果の定量的な評価が可能となる., 一般社団法人電子情報通信学会, 日本語
  • PLSAを用いた映像の構造解析に基づくシーン分割手法の高精度化 : Sequence Alignment の導入による新たな類似度の定義
    山本 誠, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 123, 128, 2010年02月08日
    本文では,映像中に存在する連続した複数のショットに注目した構造解析に基づき,高精度なシーン分割を可能とする手法を提案する.提案手法では,Sequence Alignmentの一手法であるDynamic Time Warping(DTW)により複数ショット間において伸縮を許容した類似度の算出を可能とし,これを用いることで構造解析を行う.このとき,映像中のショットから得られる特徴量に対してProbabilistic Latent Semantic Analysis(PLSA)を適用し,得られる結果を用いて新たにDTWのコストを定義する.以上により,複数ショットの類似性に注目した高度な構造解析が可能となり,提案手法では高精度なシーン分割が実現される., 一般社団法人電子情報通信学会, 日本語
  • Web コミュニティ抽出に基づく映像検索手法の高精度化に関する検討 : 映像の類似性に注目したクラスタリング手法の導入
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 129, 132, 2010年02月08日
    本文では,映像の類似性に注目したクラスタリング手法を導入したWebコミュニティ抽出に基づく高精度な検索手法を提案する.提案手法では,映像及びその映像を含むWebページから得られる特徴の類似性に基づき,重み付けを行ったリンク関係にリンク解析を施し,類似した映像を含むWebページの集合であるWebコミュニティを抽出する.さらに,抽出されたWebコミュニティ内に含まれる映像の類似性に基づいてクラスタリングを行う.これにより,ユーザはWebコミュニティから得られた類似した特徴の映像を含むクラスタを用いて効果的に検索することが可能となる.したがって,提案手法は類似した内容と特徴を持つ映像の効果的な検索を実現する., 一般社団法人電子情報通信学会, 日本語
  • 個人の嗜好に基づいた楽曲の推薦に関する一検討 : 嗜好に関するモデルの類似性を表す指標の導入
    小林 和也, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 171, 174, 2010年02月08日
    本文では,個人の嗜好の類似性に注目した新たな楽曲推薦手法を提案する.提案手法ではまず,ユーザ毎に好みに関する評価が行われている楽曲を教師データとし,それらから算出される特徴ベクトルに対してSupport Vector Data Description(SVDD)を適用することで,好みの楽曲を識別する超球をユーザ毎に算出する.ここで,提案手法ではユーザ間における嗜好の類似性を表す指標を新たに定義し,この指標に基づいて嗜好の類似するユーザの組み合わせを選択する.次に,提案手法では推薦対象ユーザに対する超球の中心とテストデータとして与えられるデータベース内の特徴ベクトルとの距離に基づいて算出される確率,及び選択された嗜好の類似するユーザの超球を用いて同様に算出される確率に基づいて,推薦結果を出力する.その結果,提案手法はユーザ間における嗜好の類似性に注目した高精度な楽曲推薦が期待できる., 一般社団法人電子情報通信学会, 日本語
  • 道路監視カメラ映像の交通流計測に関する一考察 : 撮影環境の変化による精度低下の抑制に関する検討
    村山 聖太, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 175, 178, 2010年02月08日
    本文では,道路監視カメラにより撮影された映像に対して,撮影環境の変化による精度低下を抑制した交通流の計測を行う手法を提案する.提案手法では,車線内を走行する車両を,車体やヘッドライトの濃度値に基づいて検出する.その際,車両領域の存在および通過を判定するために用いるパラメータは,天候の変化に伴う照度変化に合わせて適切に設定する必要がある.そこで,提案手法では,照度と関連が強い画像特徴を用いて,重回帰分析によりパラメータを推定する.これにより,撮影環境が異なる映像においても,適用可能となるようにパラメータが設定され,高精度な交通流計測が期待される., 一般社団法人電子情報通信学会, 日本語
  • アクティブグリッドを用いたサッカー映像における3次元パス可能領域の推定に関する一考察
    高橋 翔, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 109, 414, 185, 190, 2010年02月08日
    本稿では,アクティブグリッドを用いてサッカー映像からパスが可能な3次元領域を推定する手法を提案する.これまで,我々はサッカーフィールド上に推定されるボールの位置や選手位置を用い,パス可能領域をサッカーフィールド上に2次元の領域として推定した.しかしながら,パスコースは3次元空間上に存在するため,より高精度にパス可能領域を推定するためには3次元の領域として推定する必要がある.そこで,提案手法では,選手とボールの位置を用いて選手が移動可能な3次元空間を定式化し,3次元のボリュームデータを生成することで,領域抽出手法であるアクティブグリッドの適用を可能とする.これにより,アクティブグリッドを用いた3次元のパス可能領域推定が実現される., 一般社団法人電子情報通信学会, 日本語
  • 3次元モデルによるパラメトリック固有空間法を用いた多関節物体の姿勢推定の高度化に関する検討
    角野 公亮, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 1, 4, 2010年02月08日
    本文では,パラメトリック固有空間法を用いて2次元の画像中に存在する多関節物体の姿勢を推定する手法を提案する.提案手法では,多関節物体の3次元モデルから様々な姿勢でのシルエット画像を生成し,それらの画素値をデータとして固有ベクトルを求め,固有空間を得る.次に,各シルエット画像を固有空間上の点に投影し,点の補間を行うことで,姿勢の連続的な変化を表す多様体を構成する.さらに,入力画像に撮像された姿勢推定対象の多関節物体のシルエット画像を固有空間に投影し,多様体上の点との距離を観察することで,最適なパラメータを推定する.このとき,多関節物体を木構造とみなし,根元から末端に向かって段階的にパラメータの最適解を求める事で,計算コストを削減した姿勢推定を実現する., 一般社団法人電子情報通信学会, 日本語
  • バレーボール映像における選手及びボールの追跡とそのイベント推定への応用
    高橋 茂樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 17, 22, 2010年02月08日
    本文では,バレーボール映像における新たなボール追跡手法を提案し,レシーブやトス等の試合中のイベント推定への応用について検討を行なう.提案するボール追跡手法では,まず,バレーボール映像中において選手間でボールが放物運動を行なう点に着目し,追跡された選手位置に基づいたボールの軌跡を求める.次に,提案手法は,得られたボールの軌跡を用いることで,その追跡と共にイベント推定において重要となるボールに接触した選手とその時刻の取得を可能とする.さらに,我々は,バレーボールのルールに基づいて,提案手法をイベント推定へ応用する方法について検討を行なう。本文の最後では,実際のバレーボール映像を用いた実験を行い,提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 群化の性質に基づいた連想型映像検索の定量評価に関する検討
    徳本 了太, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 119, 122, 2010年02月08日
    本稿では,ゲシュタルト心理学における群化の性質に基づき,連想型映像検索結果を定量的に評価する評価値を提案する.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する連想型映像検索システムを提案した.しかしながら,この手法では検索結果の定量的評価に至ることができなかった.そこで,本稿では,連想型映像検索結果を評価するためのモデルを定義する.そのモデルにおいて形成される映像の群を群化とし,その程度を表す定量値を算出する.さらに,定量値を用いて連想型映像検索結果の有効性を評価するための評価値を定義する.その評価値の大小を比較することで,連想型映像検索結果の定量的な評価が可能となる., 一般社団法人電子情報通信学会, 日本語
  • PLSAを用いた映像の構造解析に基づくシーン分割手法の高精度化 : Sequence Alignment の導入による新たな類似度の定義
    山本 誠, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 123, 128, 2010年02月08日
    本文では,映像中に存在する連続した複数のショットに注目した構造解析に基づき,高精度なシーン分割を可能とする手法を提案する.提案手法では,Sequence Alignmentの一手法であるDynamic Time Warping (DTW)により複数ショット間において伸縮を許容した類似度の算出を可能とし,これを用いることで構造解析を行う.このとき,映像中のショットから得られる特徴量に対してProbabilistic Latent Semantic Analysis (PLSA)を適用し,得られる結果を用いて新たにDTWのコストを定義する.以上により,複数ショットの類似性に注目した高度な構造解析が可能となり,提案手法では高精度なシーン分割が実現される., 一般社団法人電子情報通信学会, 日本語
  • Web コミュニティ抽出に基づく映像検索手法の高精度化に関する検討 : 映像の類似性に注目したクラスタリング手法の導入
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 129, 132, 2010年02月08日
    本文では,映像の類似性に注目したクラスタリング手法を導入したWebコミュニティ抽出に基づく高精度な検索手法を提案する.提案手法では,映像及びその映像を含むWebページから得られる特徴の類似性に基づき,重み付けを行ったリンク関係にリンク解析を施し,類似した映像を含むWebページの集合であるWebコミュニティを抽出する.さらに,抽出されたWebコミュニティ内に含まれる映像の類似性に基づいてクラスタリングを行う.これにより,ユーザはWebコミュニティから得られた類似した特徴の映像を含むクラスタを用いて効果的に検索することが可能となる.したがって,提案手法は類似した内容と特徴を持つ映像の効果的な検索を実現する., 一般社団法人電子情報通信学会, 日本語
  • 個人の嗜好に基づいた楽曲の推薦に関する一検討 : 嗜好に関するモデルの類似性を表す指標の導入
    小林 和也, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 171, 174, 2010年02月08日
    本文では,個人の嗜好の類似性に注目した新たな楽曲推薦手法を提案する.提案手法ではまず,ユーザ毎に好みに関する評価が行われている楽曲を教師データとし,それらから算出される特徴ベクトルに対してSupport Vector Data Description (SVDD)を適用することで,好みの楽曲を識別する超球をユーザ毎に算出する.ここで,提案手法ではユーザ間における嗜好の類似性を表す指標を新たに定義し,この指標に基づいて嗜好の類似するユーザの組み合わせを選択する.次に,提案手法では推薦対象ユーザに対する超球の中心とテストデータとして与えられるデータベース内の特徴ベクトルとの距離に基づいて算出される確率,及び選択された嗜好の類似するユーザの超球を用いて同様に算出される確率に基づいて,推薦結果を出力する.その結果,提案手法はユーザ問における嗜好の類似性に注目した高精度な楽曲推薦が期待できる., 一般社団法人電子情報通信学会, 日本語
  • 道路監視カメラ映像の交通流計測に関する一考察 : 撮影環境の変化による精度低下の抑制に関する検討
    村山 聖太, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 175, 178, 2010年02月08日
    本文では,道路監視カメラにより撮影された映像に対して,撮影環境の変化による精度低下を抑制した交通流の計測を行う手法を提案する.提案手法では,車線内を走行する車両を,車体やヘッドライトの濃度値に基づいて検出する.その際車両領域の存在および通過を判定するために用いるパラメータは,天候の変化に伴う照度変化に合わせて適切に設定する必要がある.そこで,提案手法では,照度と関連が強い画像特徴を用いて,重回帰分析によりパラメータを推定する.これにより,撮影環境が異なる映像においても,適用可能となるようにパラメータが設定され,高精度な交通流計測が期待される., 一般社団法人電子情報通信学会, 日本語
  • アクティブグリッドを用いたサッカー映像における3次元パス可能領域の推定に関する一考察
    高橋 翔, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 415, 185, 190, 2010年02月08日
    本稿では,アクティブグリッドを用いてサッカー映像からパスが可能な3次元領域を推定する手法を提案する.これまで,我々はサッカーフィールド上に推定されるボールの位置や選手位置を用い,パス可能領域をサッカーフィールド上に2次元の領域として推定した.しかしながら,パスコースは3次元空間上に存在するため,より高精度にパス可能領域を推定するためには3次元の領域として推定する必要がある.そこで,提案手法では,選手とボールの位置を用いて選手が移動可能な3次元空間を定式化し,3次元のボリュームデータを生成することで,領域抽出手法であるアクティブグリッドの適用を可能とする.これにより,アクティブグリッドを用いた3次元のパス可能領域推定が実現される., 一般社団法人電子情報通信学会, 日本語
  • 最新!感染看護Q&A
    塚本容子, 松澤由香里, 平岡康子, 原理加, 鎌田明, 秩父千春, 塩谷光彦, 唯野貢司, 齊藤正恵, 加藤美紀, 桐則行, 西朝江, 三宮乙恵, 高井裕美, 山田佳緒里, 長谷山雅美, 石山景子, 家入裕子, 平畠弘美, 小川伸, 三宅隆仁, 小山田玲子, 石上香, 掛水智子, 五十嵐孝, 北山由香里, 四宮聡, 飯島正平, 石角鈴華, 長倉竜也, 宮崎佳奈子, 斎藤道子, 網島優, 菊地義弘, 萩野貴志, 野田久美子, 満田年宏, 看護技術, 56, 12, 2010年
  • PLAYERS TRACKING APPROACH USING LEVEL‐SET METHOD BASED ON COLOR COMPONENTS OF PLAYERS IN SOCCER VIDEOS
    TAKAHASHI Sho, LIM Wonkuk, HASEYAMA Miki, 画像符号化シンポジウム資料, 25th, 67, 68, 2010年
    英語
  • MCMC-based scene segmentation method using structure of video
    Yan Song, Takahiro Ogawa, Miki Haseyama, ISCIT 2010 - 2010 10th International Symposium on Communications and Information Technologies, 862, 866, 2010年
    Video scene segmentation and classification are fundamental steps for multimedia retrieval, browsing and indexing. In this paper, we present a robust scene segmentation approach based on the Markov Chain Monte Carlo (MCMC) method using the structure of video sequences. In our method, there are two novel approaches to segment video sequences into scenes. The first approach is the use of the video structures to extract scene boundary candidates from shot boundaries. Then using the MCMC method to select the true scene boundaries from these candidates, highly-accurate scene segmentation becomes possible. It should be noted that when the prior probability concerning the number of scenes in a target video sequence is given correctly, the MCMC method can provide a more accurate scene segmentation result. Therefore, in the second approach of the proposed method, the parameter utilized in the prior probability is set to the optimal value by using Multiple Regression Analysis (MRA). Consequently, accurate scene segmentation becomes possible by using the above novel approaches. Experimental results performed by applying the proposed method to actual broadcast programs are shown to verify the effectiveness of the proposed method. ©2010 IEEE., 英語
  • Two-step error concealment method for wavelet video coding in wireless network
    Sunmi Kim, Hirokazu Tanaka, Takahiro Ogawa, Miki Haseyama, 2010 International Conference on Intelligent and Advanced Systems, ICIAS 2010, 2010年
    We propose a two-step error concealment method based on an error resilient three-dimensional discrete wavelet transform (3-D DWT) video encoding scheme. The proposed scheme consists of an error-resilient encoder duplicating the lowest sub-band bit-streams for dispersive grouped frames and an error concealment decoder. The error concealment method of this decoder is decomposed of two steps, the first step is replacement of erroneous coefficients in the low frequency subband by the duplicated coefficients, and the second step is interpolation of the missing wavelet coefficients by minimum mean square error (MMSE) estimation. The proposed scheme can achieve robust transmission over unreliable channels. Experimental results provide performance comparisons in terms of peak signal-to-noise ratio (PSNR) and visual quality under different packet loss conditions., 英語
  • Kernel CCA-based music recommendation according to human motion robust to temporal expansion
    Hiroyuki Ohkushi, Takahiro Ogawa, Miki Haseyama, ISCIT 2010 - 2010 10th International Symposium on Communications and Information Technologies, 1030, 1034, 2010年
    This paper proposes a method for kernel canonical correlation analysis (CCA) based music recommendation robust to temporal expansion. Kernel CCA is used to find the relationship between different data sets. Generally, since motions and music pieces in video sequences have various time lengths, it is necessary to allow the internal temporal expansion of the data. Our kernel CCA-based music recommendation method uses similarities of human motions and music pieces, which are robust to internal temporal expansions. Then this approach enables successful extraction of the relationship between these data to recommend a music piece suitable for human motions. Experimental results are shown to verify the performance of the proposed method. ©2010 IEEE., 英語
  • Effective pedestrian detection using SVDD-based criterion for region integration
    Marie Katsurai, Takahiro Ogawa, Miki Haseyama, ISCIT 2010 - 2010 10th International Symposium on Communications and Information Technologies, 991, 996, 2010年
    Pedestrian detection is one of the most important techniques for surveillance applications. This paper proposes an effective method for pedestrian detection in low-contrast images. The main characteristic of the proposed method is a twostage moving object extraction. In the first stage, the watershed algorithm is used to extract multiple regions of moving objects. In the second stage, a novel criterion is introduced to integrate the segmented moving object regions. Specifically, the criterion is calculated on the basis of the distance from a center of the support vector data description (SVDD), where its hypersphere is constructed by using pedestrian features. By monitoring this SVDD-based criterion for the region integration, the segmented regions are appropriately integrated based on pedestrian features. This two-stage approach can extract the moving objects in low-contrast images and improve the performance of the pedestrian detection. Experimental results have demonstrated the effectiveness of the proposed method. ©2010 IEEE., 英語
  • A genetic algorithm for path generation and its applications
    Jun Inagaki, Tomoaki Shirakawa, Tetsuo Shimono, Miki Haseyama, APSIPA ASC 2009 - Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference, 278, 281, 2009年12月01日
    Path generation is an optimization problem mainly performed on grid maps that combines generation of paths with minimization of their cost. Several methods that belong to the class of exhaustive searches are available; however, these methods are only able to obtain a single path as a solution for each iteration of the search. Conversely, while genetic algorithms involving a type of multipoint search methods have been proposed as suitable candidates for this problem with the goal of simultaneously searching for multiple candidate paths, these methods are limited to particular applications, and there are limitations on the types of paths that can be represented. This paper therefore proposes a path generation method that is applicable to more general-purpose applications compared to previous methods based on a new design of the genotype used in the genetic algorithm.
  • Quality estimation of fractal coded images by using level of self-similarity
    Megumi Takezawa, Hirofumi Sanada, Kazuhisa Watanabe, Miki Haseyama, APSIPA ASC 2009 - Asia-Pacific Signal and Information Processing Association 2009 Annual Summit and Conference, 837, 840, 2009年12月01日
    Fractal image coding is a technique for coding digital images. It can provide the compressed images with higher quality than JPEG compression at ultra low bit-rates. However, we cannot use it as a practical coding technique. One of the reasons is that the quality of some of the compressed images is not sufficient for practical applications. Moreover, what is I more inconvenient is that we cannot know the compressed image quality of a given image unless we actually encode and decode it which takes a lot of time. Therefore, we decided to try to resolve this problem by implementing the following steps: (i) we find the important image features which relate to the quality of the compressed images, and we establish an estimation method of the compressed image quality by using the important image feature 1 values, (ii) Then, based on the estimated quality by this method, we apply the fractal image coding to each image adaptively. This paper presents the above step (i).
  • Performance of Adaptive Trellis Coded Modulation Applied to MC-CDMA with Bi-orthogonal Keying
    Hirokazu Tanaka, Shoichiro Yamasaki, Miki Haseyama, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 11, 2837, 2843, 2009年11月
    A Generalized Symbol-rate-increased (GSRI) Pragmatic Adaptive Trellis Coded Modulation (ATCM) is applied to a Multi-carrier CDMA (MC-CDMA) system with bi-orthogonal keying is analyzed. The MC-CDMA considered in this paper is that the input sequence. of a bi-orthogonal modulator has code selection bit sequence and sign bit sequence. In [9], an efficient error correction code using Reed-Solomon (RS) code for the code selection bit sequence has been proposed. However, since BPSK is employed for the sign bit modulation, no error correction code is applied to it. In-order to realize a high speed wireless system, a multi-level modulation scheme (e.g. MPSK, MQAM, etc.) is desired. In this paper, we investigate the performance of the MC-CDMA with bi-orthogonal keying employing GSRI ATCM. GSRI TC-MPSK can arbitrarily set the bandwidth expansion ratio keeping higher coding gain than the conventional pragmatic TCM scheme. By changing the modulation scheme and the bandwidth expansion ratio (coding rate), this scheme can optimize the performance according to the channel conditions. The performance evaluations by simulations on an AWGN channel and multi-path fading channels are presented. It is shown that the proposed scheme has remarkable throughput performance than that of the conventional scheme., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • Performance of Adaptive Modulation and Coding (AMC) on multi-carrier CDMA for mobile multimedia transmission
    Hirokazu Tanaka, Shoichiro Yanasaki, Miki Haseyama, 2009 IEEE International Symposium on Broadband Multimedia Systems and Broadcasting, BMSB 2009, 761, +, 2009年10月29日
    In this paper, we investigate the performance of MC-CDMA with bi-orthogonal keying employing Generalized Symbol-rate-increased (GSRI) Pragmatic Adaptive Trellis Coded Modulation (ATCM). It is advantageous that the GSRI TC-MPSK can arbitrarily set the bandwidth expansion ratio (coding rate) and higher coding gain than the conventional pragmatic TCM scheme can be obtained. By changing the modulation scheme and the bandwidth expansion ratio, this scheme can optimize the performance according to the channel conditions. The performance evaluations by simulations on an AWGN channel and multi-path fading channels are presented. It is shown that the proposed scheme has remarkable throughput performance than that of the conventional scheme., IEEE, 英語
  • 個人の嗜好を考慮した楽曲間の距離尺度とその類似楽曲検索への応用に関する考察
    小林 和也, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 44, 3, 6, 2009年10月26日
    本文では,高精度な類似楽曲検索を実現するため,ユーザの嗜好を考慮した楽曲間の新たな距離尺度を提案する.提案手法では,メロディー,リズム,音色を表す特徴ベクトルを用いてマハラノビス距離の形式を持つ距離関数を定義し,その際用いられる行列をユーザの嗜好を表すパラメータとして学習する.このとき,提案手法は類似楽曲間の距離が他の楽曲間との距離と比較して小さな場合に低い値を示すコスト関数を設定し,これを最小化することで行列を求める.この行列をユーザ毎に変更することで,提案手法は各々のユーザに対して類似楽曲間の距離が小さくなる距離尺度が得られ,ユーザの望む類似楽曲を高精度に検索することが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • 映像の構造解析によるシーン分割の高精度化に関する検討PLSAにより得られる新たな特徴量を用いたアプローチ
    山本 誠, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 44, 7, 10, 2009年10月26日
    本文では,映像から抽出される特徴量に内在する特性を統計的に解析し,その結果を用いることで高精度にシーン分割を行う手法を提案する.提案手法では,同一番組の映像のみで構成されるデータセットに対して,確率モデルに基づいてデータ中に内在する特性を解析する統計的手法Probabilistic Latent Semantic Analysis(PLSA)を適用し,それらの映像の特徴量に内在する特性を解析する.これにより得られる解析結果から新たな特徴量を算出することで,映像の特徴量を直接用いた場合に生じる精度の劣化を抑制したシーン分割が実現される.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • 群化に基づいた映像検索結果の可視化に関する検討
    徳本 了太, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 44, 47, 50, 2009年10月26日
    本文では,ゲシュタルト心理学における群化の性質に基づき,検索履歴を考慮して映像検索結果を可視化する手法を提案する.群化とは,視野に存在する複数の図形をある一定のまとまりとして認識する人間の知覚現象である.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する映像検索システムを提案した.しかしながら,従来手法におけるインターフェースでは過去の検索履歴を考慮した可視化が行われていない.そのため,ユーザは過去と現在の映像検索結果との間において類似している映像,および現在の検索において新規に得られた映像を明確に区別することができず,検索履歴に沿った一連の流れにおける映像検索結果の変化を確認することが困難だった.そこで本文では,動画像特徴量と検索履歴を元に3次元空間に映像を配置し,さらに群化の性質に基づいた可視化を行うことで,効果的な映像検索結果の可視化を検討する., 一般社団法人映像情報メディア学会, 日本語
  • フレームの再構成に基づくDVCの符号化効率向上に関する検討 : 誤り訂正に基づく Key フレーム及び Wyner-Ziv フレームの再構成の導入
    高橋 茂樹, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 44, 51, 54, 2009年10月26日
    本文では,distributed video coding(DVC)の符号化効率向上を可能とする手法を提案する.提案手法では,符号化前にKeyフレームに対して消失領域を発生させることで符号量の削減を行う.また,提案手法の復号器では,消失領域を補間し,さらに,Wyner-Zivフレーム(WZフレーム)の復号の際の誤り訂正に基づき,WZフレーム及び隣接するKeyフレームを再構成する.その結果,WZフレームの復号結果がより高精度に再構成されると共に,Keyフレームにおける消失領域の補間誤差が効果的に低減され,従来のDVCに比べ高いRate-Distortion(RD)性能を実現することが可能となる.本文の最後では,実験を行い提案手法の有効性を示す., 一般社団法人映像情報メディア学会, 日本語
  • Webのリンク構造に注目したNear‐Duplicate映像検出に関する検討
    池田啓典, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, ROMBUNNO.157, 2009年10月17日
    日本語
  • 映像の構造に基づいたシーン分割の高精度化に関する検討
    宋妍, 山本誠, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, ROMBUNNO.155, 2009年10月17日
    日本語
  • 気象データ解析のための動き推定法の高精度化に関する一考察
    李徳智, 覚幸典弘, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, ROMBUNNO.154, 2009年10月17日
    日本語
  • 画像特徴量の適応的な重み付けを導入したロジスティック回帰モデルによる画像内容に基づく類似画像検索手法の検討
    桂井麻里衣, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, ROMBUNNO.156, 2009年10月17日
    日本語
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討―原画像の事前確率に対する適応的な選択法の導入―
    和泉大佑, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, ROMBUNNO.158, 2009年10月17日
    日本語
  • Performance of Reed-Solomon Coded MC-DS-CDMA with Bi-orthogonal Modulation
    Hirokazu Tanaka, Kyung Woon Jang, Shoichiro Yamasaki, Miki Haseyama, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 10, 2600, 2608, 2009年10月
    In this paper, an error correction scheme suitable for MC-DS-CDMA system with bi-orthogonal modulation is proposed. The input sequence of a bi-orthogonal modulator consists of n - 1 bit code selection bit sequence and 1 bit sign bit sequence. In order to apply an efficient error correction code, the following points should be considered; (1) if the code selection bits can be protected sufficiently, the sign bit error can also be reduced sufficiently, (2) since a code selection bit sequence consists of n - 1 bits, employing a symbol error correcting code is more effective for encoding code selection bits, (3) the complexity of the error correction encoder and decoder implementations should be minimum. Based on these conditions, we propose to employ Reed-Solomon (RS) code for encoding the code selection bits and no error correction code for the sign bit, Additionally, detection algorithm at the bi-orthogonal demodulator is modified for compensating degradations of the sign bit error rate performance. The performance in an Additive White Gaussian Noise (AWGN) channel is evaluated by both theoretical analysis and computer simulations. The performance evaluations by simulations on multi-path fading channels are also shown. It is shown that the proposed scheme has remarkable improvement., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • Video Frame Interpolation by Image Morphing Including Fully Automatic Correspondence Setting
    Miki Haseyama, Makoto Takizawa, Takashi Yamamoto, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E92D, 10, 2163, 2166, 2009年10月
    In this paper, it new video frame interpolation method based on image morphing for frame rate up-conversion is proposed. In this method, image features are extracted by Scale-Invariant Feature Transform in each frame, and their correspondence in two contiguous frames is then computed separately in foreground and background regions. By using the above two functions, the proposed method accurately generates interpolation frames and thus achieves frame rate up-conversion., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • 音声認識を用いた高精度なシーン分割に関する一検討 : 撮像物体の対応付けによる動画像の構造解析の導入
    成田 容, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 33, 17, 20, 2009年08月03日
    本文では,音声認識結果に基づく新たな特徴量を定義し,その特徴量を用いてシーン分割の高精度化を行う手法を提案する.提案手法では,処理対象映像中の固定長の小区間において,音声認識結果から得られる単語の出現分布に基づき新たな特徴量を定義する.さらに,この特徴量を用いることで算出される区間同士の類似度を話題の類似度として定義する.この話題の類似度の時間変化から話題が切り替わるおよその時刻が検出されるため,その時刻に注目することで,既存のシーン分割手法との併用によりシーンカットの過剰検出を抑制することが可能となる.その結果,従来よりも映像の内容に基づいた高精度なシーン分割が実現される., 一般社団法人映像情報メディア学会, 日本語
  • 画像検索のためのSVDDに基づく対象物の自動抽出に関する考察
    岡田 周史, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 33, 13, 16, 2009年08月03日
    本文では,画像検索のためのSVDDに基づく対象物の自動抽出手法を提案する.提案手法では,教師画像として与えられる対象物を含む画像および含まない画像にSVDDを適用することで,対象物が存在する領域を自動で抽出する.具体的に,SVDDにより算出される識別超球の中心からの距離に基づき,局所ブロックから得られる特徴ベクトルが対象クラスに属する確率を定義し,この確率の下,教師画像から対象物が存在する正例領域および存在しない負例領域の取得を可能とする.このとき,提案手法では,正例領域と負例領域をより高精度に分離することが可能な識別超球を与えるように,用いる特徴量を適応的に選択する.以上の超球の算出と正例領域および負例領域の抽出を,領域のサイズを変更して繰り返し行うことにより,あらかじめ教師画像から対象物を抽出することなく,画像中から対象物の検出が可能となるため,対象物に注目した画像検索が期待できる., 一般社団法人映像情報メディア学会, 日本語
  • A Novel Video Retrieval Method Based on Web Community Extraction Using Features of Video Materials
    Yasutaka Hatakeyama, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E92A, 8, 1961, 1969, 2009年08月
    A novel video retrieval method based on Web community extraction using audio and visual features and textual features of video materials is proposed in this paper. In this proposed method, canonical correlation analysis is applied to these three features calculated from video materials and their Web pages, and transformation of each feature into the same variate space is possible. The transformed variates are based on the relationships between visual, audio and textual features of video materials, and the similarity between video materials in the same feature space for each feature can be calculated. Next, the proposed method introduces the obtained similarities of video materials into the link relationship between their Web pages. Furthermore, by performing link analysis of the obtained weighted link relationship, this approach extracts Web communities including similar topics and provides the degree of attribution of video materials in each Web community for each feature. Therefore, by calculating similarities of the degrees of attribution between the Web communities extracted from the three kinds of features, the desired ones are automatically selected. Consequently, by monitoring the degrees of attribution of the obtained Web communities, the proposed method can perform effective video retrieval. Some experimental results obtained by applying the proposed method to video materials obtained from actual Web pages are shown to verify the effectiveness of the proposed method., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • 映像のシーン検索のための可視化インタフェース
    長谷山 美紀, 電子情報通信学会技術研究報告. MI, 医用画像, 109, 65, 153, 157, 2009年05月21日
    大量に蓄積された映像の視聴や検索を目的として行われた,映像処理技術と検索インタフェース実現に関する研究について紹介する.提案する検索インタフェースを用いることで,従来では困難であったユーザが明確なクエリを持ち合わせない場合においても,効果的に検索を行うことが可能となる.本文では,実際に実現されたインタフェースにより行われた検索結果を提示し,映像固有の多義性と曖昧性から,ユーザが効率的に望む映像に到達するために,検索結果を効果的に可視化するシステムの必要性について議論する., 一般社団法人電子情報通信学会, 日本語
  • 映像のシーン検索のための可視化インタフェース
    長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 109, 63, 153, 157, 2009年05月21日
    大量に蓄積された映像の視聴や検索を目的として行われた,映像処理技術と検索インタフェース実現に関する研究について紹介する.提案する検索インタフェースを用いることで,従来では困難であったユーザが明確なクエリを持ち合わせない場合においても,効果的に検索を行うことが可能となる.本文では,実際に実現されたインタフェースにより行われた検索結果を提示し,映像固有の多義性と曖昧性から,ユーザが効率的に望む映像に到達するために,検索結果を効果的に可視化するシステムの必要性について議論する., 一般社団法人電子情報通信学会, 日本語
  • 映像のシーン検索のための可視化インタフェース
    長谷山 美紀, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 109, 64, 153, 157, 2009年05月21日
    大量に蓄積された映像の視聴や検索を目的として行われた,映像処理技術と検索インタフェース実現に関する研究について紹介する.提案する検索インタフェースを用いることで,従来では困難であったユーザが明確なクエリを持ち合わせない場合においても,効果的に検索を行うことが可能となる.本文では,実際に実現されたインタフェースにより行われた検索結果を提示し,映像固有の多義性と曖昧性から,ユーザが効率的に望む映像に到達するために,検索結果を効果的に可視化するシステムの必要性について議論する., 一般社団法人電子情報通信学会, 日本語
  • パーティクルフィルタの拡張に関する検討 : 動画像のフロー推定への応用
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 157, 162, 2009年02月04日
    本文では,パーティクルフィルタを拡張し,ヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,互いに影響を与える2つの状態変数を含む状態遷移モデル,および一時刻前の観測が影響を与える観測モデルを用いる.これらのモデルを従来のパーティクルフィルタで用いる場合,従来法の仮定である,現時刻の状態変数の値が一時刻前の自身の値に従属すること,および現時刻の観測の値が現時刻の状態変数の値に従属することを満たさない.そのため,上述のモデルを満たす仮定を新たに用いることで,パーティクルフィルタを拡張する.さらに本文では,拡張したパーティクルフィルタをヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,2つの状態変数を順方向および逆方向のフローとして,それぞれの状態遷移モデルをフローの性質に基づいて定義する.また,勾配法および平行移動を表す成分に注目して拡張したヘルムホルツ分解定理のモデルを用いて,観測モデルおよび観測密度を定義する.これらの定義に基づくパーティクルフィルタでは,一時刻前の推定誤差の影響を受けない,輝度値の勾配,回転,発散,および平行移動に基づくフロー推定が可能である.その結果,高精度なフロー推定法が実現される., 一般社団法人映像情報メディア学会, 日本語
  • 映像の特徴に注目した Web 映像検索手法の高精度化 : 正準相関分析を用いたコミュニティ抽出に関する一検討
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 93, 96, 2009年02月04日
    本文では,映像の特徴に注目した高精度なWeb映像検索手法を提案する.提案手法では,まず映像信号から得られる画像特徴及び音響特徴,映像を含むWebページのテキストから得られるテキスト特徴に対して正準相関分析を施すことで,新変量の空間における異なる特徴間での映像の類似度定義を可能とする.さらに,各映像の特徴をそれぞれ一つのWebページとみなし,得られる類似度に基づいた隣接行列の生成を行なう.その結果,提案手法では隣接行列にリンク解析を施すことで,類似した内容を含む映像の集合であるコミュニティの抽出が可能となり,映像の特徴に注目した効果的な映像検索が実現される., 一般社団法人映像情報メディア学会, 日本語
  • SVDDに基づいた静止画像の適応的高解像度化に関する検討
    小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 269, 274, 2009年02月04日
    本文では,Support Vector Data Description(SVDD)に基づいた静止画像の適応的高解像度化手法を提案する.提案手法ではまず,教師データとして与えられる高解像度の局所画像にSVDDを適用することで,識別超球の算出を行い,その中心との距離が最小となるように高解像度化の対象となる画像の未知の高周波成分を推定する.ここで,我々は画像の異なる階層間において局所画像が互いに類似する特徴に注目し,低解像度画像中の局所画像を教師データとして利用する.さらに,様々な種類のテクスチャを含む自然画像に対して高精度な高解像度化を可能とするため,提案手法では教師データとなる局所画像をあらかじめクラスタリングし,各クラスタについて得られる超球を用いて上記の未知の高周波成分の推定を行う.このとき,提案手法では各クラスタについて,推定される結果と超球の中心との距離に基づいて定義される確率の下,最終出力を決定する.その結果,テクスチャの種類に応じた未知の高周波成分の推定が可能となり,高精度な画像の高解像度化が期待できる.本文の最後では,提案手法の有効性を示すため,実画像を用いた比較実験を行い,その性能の評価を行う., 一般社団法人映像情報メディア学会, 日本語
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討
    瀧澤 誠, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 265, 268, 2009年02月04日
    本文では,超解像処理を用いて,手ぶれにより劣化した動画像を復元・高解像度化する手法を提案する.提案手法では,動画像の各フレームに対し,手ぶれの劣化関数であるPSF(Point Spread Function)を推定し,得られるPSFを用いてフレーム間における対応を算出する.さらに,手ぶれ方向への平滑化を抑制する重み係数を新たに導入した超解像処理を適用することで,ぶれ方向への過剰な平滑化が抑制された高精度な復元および高解像度化を実現する.本文の最後では,比較実験を行い,提案手法の有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • 位相回復手法を用いた静止画像の高解像度化に関する一考察
    平松 朋樹, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 261, 264, 2009年02月04日
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像の高解像度化手法を提案する.提案手法では,まず,低解像度画像における自己相関関数に対して相関値の補間処理を施すことで,高解像度画像における自己相関関数を推定する.このとき,Wiener-Khintchineの定理により,推定された高解像度画像の自己相関関数をフーリエ変換することで,高解像度画像におけるフーリエ振幅を得ることが可能となるため,これをERアルゴリズムにおけるフーリエ領域の拘束条件として導入する.さらに,低解像度画像から得られる周波数成分を高解像度画像における既知の低周波成分とし,これを画像領域における拘束条件として導入する.以上のようにして導出されるERアルゴリズムを用いてフーリエ位相の回復を行うことで,失われた高周波成分が自己相関関数の補間により生成され,低解像度画像のみから高解像度画像を得ることが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • サッカー映像における選手位置および撮像されたフィールド領域の推定に関する一考察
    林 原局, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 229, 232, 2009年02月04日
    本稿では,2つのパーティクルフィルタを用いることで,サッカー映像から選手位置および撮像されたフィールド領域を高精度に推定する手法を提案する.提案手法では,サッカー映像における選手の位置を推定するパーティクルフィルタおよびサッカー映像を撮像しているカメラのパラメータを推定するパーティクルフィルタを定義する.このとき,各パーティクルフィルタにより得られる推定結果を互いの観測モデルへ導入し,それぞれ状態遷移を行うことにより選手位置およびフィールド領域の高精度な推定を可能とする., 一般社団法人映像情報メディア学会, 日本語
  • 3次元ウェーブレットによる誤り耐性動画像符号化法とエラーコンシールメント法に関する一考察
    金 善美, 田中 宏和, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 33, 6, 47, 51, 2009年02月04日
    無線伝送に適した3次元ウェーブレットによる誤り耐性動画像符号化法とそのエラーコンシールメント技術について検討する。本文において我々は、各動画像フレームを空間方向にウェーブレット変換したとき、近隣のウェーブレット係数は相関性が存在することに着目する。そこで、提案手法では係数を複数グループに分散的にグループ化した後、これらのグループ毎に時間方向のウェーブレット変換を行う新たな符号化法を導入する。さらに、受信側においてこれらのグループの複数が伝送路誤りによって欠落した際においても効率良く補間可能なエラーコンシールメント法を提案する。.本文の最後では、評価実験により提案方式の有効性を確認する。, 一般社団法人映像情報メディア学会, 英語
  • SVDDに基づいた静止画像の適応的高解像度化に関する検討
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 269, 274, 2009年01月28日
    本文では,Support Vector Data Description(SVDD)に基づいた静止画像の適応的高解像度化手法を提案する.提案手法ではまず,教師データとして与えられる高解像度の局所画像にSVDDを適用することで,識別超球の算出を行い,その中心との距離が最小となるように高解像度化の対象となる画像の未知の高周波成分を推定する.ここで,我々は画像の異なる階層間において局所画像が互いに類似する特徴に注目し,低解像度画像中の局所画像を教師データとして利用する.さらに,様々な種類のテクスチャを含む自然画像に対して高精度な高解像度化を可能とするため,提案手法では教師データとなる局所画像をあらかじめクラスタリングし,各クラスタについて得られる超球を用いて上記の未知の高周波成分の推定を行う.このとき,提案手法では各クラスタについて,推定される結果と超球の中心との距離に基づいて定義される確率の下,最終出力を決定する.その結果,テクスチャの種類に応じた未知の高周波成分の推定が可能となり,高精度な画像の高解像度化が期待できる.本文の最後では,提案手法の有効性を示すため,実画像を用いた比較実験を行い,その性能の評価を行う., 一般社団法人電子情報通信学会, 日本語
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討
    瀧澤 誠, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 265, 268, 2009年01月28日
    本文では,超解像処理を用いて,手ぶれにより劣化した動画像を復元・高解像度化する手法を提案する.提案手法では,動画像の各フレームに対し,手ぶれの劣化関数であるPSF(Point Spread Function)を推定し,得られるPSFを用いてフレーム間における対応を算出する.さらに,手ぶれ方向への平滑化を抑制する重み係数を新たに導入した超解像処理を適用することで,ぶれ方向への過剰な平滑化が抑制された高精度な復元および高解像度化を実現する.本文の最後では,比較実験を行い,提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 位相回復手法を用いた静止画像の高解像度化に関する一考察
    平松 朋樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 261, 264, 2009年01月28日
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像の高解像度化手法を提案する.提案手法では,まず,低解像度画像における自己相関関数に対して相関値の補間処理を施すことで,高解像度画像における自己相関関数を推定する.このとき,Wiener-Khintchineの定理により,推定された高解像度画像の自己相関関数をフーリエ変換することで,高解像度画像におけるフーリエ振幅を得ることが可能となるため,これをERアルゴリズムにおけるフーリエ領域の拘束条件として導入する.さらに,低解像度画像から得られる周波数成分を高解像度画像における既知の低周波成分とし,これを画像領域における拘束条件として導入する.以上のようにして導出されるERアルゴリズムを用いてフーリエ位相の回復を行うことで,失われた高周波成分が自己相関関数の補間により生成され,低解像度画像のみから高解像度画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像における選手位置および撮像されたフィールド領域の推定に関する一考察
    林 原局, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 229, 232, 2009年01月28日
    本稿では,2つのパーティクルフィルタを用いることで,サッカー映像から選手位置および撮像されたフィールド領域を高精度に推定する手法を提案する.提案手法では,サッカー映像における選手の位置を推定するパーティクルフィルタおよびサッカー映像を撮像しているカメラのパラメータを推定するパーティクルフィルタを定義する.このとき,各パーティクルフィルタにより得られる推定結果を互いの観測モデルへ導入し,それぞれ状態遷移を行うことにより選手位置およびフィールド領域の高精度な推定を可能とする., 一般社団法人電子情報通信学会, 日本語
  • パーティクルフィルタの拡張に関する検討 : 動画像のフロー推定への応用
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 157, 162, 2009年01月28日
    本文では,パーティクルフィルタを拡張し,ヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,互いに影響を与える2つの状態変数を含む状態遷移モデル,および一時刻前の観測が影響を与える観測モデルを用いる.これらのモデルを従来のパーティクルフィルタで用いる場合,従来法の仮定である,現時刻の状態変数の値が一時刻前の自身の値に従属すること,および現時刻の観測の値が現時刻の状態変数の値に従属することを満たさない.そのため,上述のモデルを満たす仮定を新たに用いることで,パーティクルフィルタを拡張する.さらに本文では,拡張したパーティクルフィルタをヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,2つの状態変数を順方向および逆方向のフローとして,それぞれの状態遷移モデルをフローの性質に基づいて定義する.また,勾配法および平行移動を表す成分に注目して拡張したヘルムホルツ分解定理のモデルを用いて,観測モデルおよび観測密度を定義する.これらの定義に基づくパーティクルフィルタでは,一時刻前の推定誤差の影響を受けない,輝度値の勾配,回転,発散,および平行移動に基づくフロー推定が可能である.その結果,高精度なフロー推定法が実現される., 一般社団法人電子情報通信学会, 日本語
  • 映像の特徴に注目した Web 映像検索手法の高精度化 : 正準相関分析を用いたコミュニティ抽出に関する一検討
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 93, 96, 2009年01月28日
    本文では,映像の特徴に注目した高精度なWeb映像検索手法を提案する.提案手法では,まず映像信号から得られる画像特徴及び音響特徴,映像を含むWebページのテキストから得られるテキスト特徴に対して正準相関分析を施すことで,新変量の空間における異なる特徴間での映像の類似度定義を可能とする.さらに,各映像の特徴をそれぞれ一つのWebページとみなし,得られる類似度に基づいた隣接行列の生成を行なう.その結果,提案手法では隣接行列にリンク解析を施すことで,類似した内容を含む映像の集合であるコミュニティの抽出が可能となり,映像の特徴に注目した効果的な映像検索が実現される., 一般社団法人電子情報通信学会, 日本語
  • 3次元ウェーブレットによる誤り耐性動画像符号化法とエラーコンシールメント法に関する一考察
    金 善美, 田中 宏和, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 425, 47, 51, 2009年01月28日
    無線伝送に適した3次元ウェーブレットによる誤り耐性動画像符号化法とそのエラーコンシールメント技術について検討する。本文において我々は、各動画像フレームを空間方向にウェーブレット変換したとき、近隣のウェーブレット係数は相関性が存在することに着目する。そこで、提案手法では係数を複数グループに分散的にグループ化した後、これらのグループ毎に時間方向のウェーブレット変換を行う新たな符号化法を導入する。さらに、受信側においてこれらのグループの複数が伝送路誤りによって欠落した際においても効率良く補間可能なエラーコンシールメント法を提案する。本文の最後では、評価実験により提案方式の有効性を確認する。, 一般社団法人電子情報通信学会, 英語
  • SVDDに基づいた静止画像の適応的高解像度化に関する検討
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 269, 274, 2009年01月28日
    本文では,Support Vector Data Description(SVDD)に基づいた静止画像の適応的高解像度化手法を提案する.提案手法ではまず,教師データとして与えられる高解像度の局所画像にSVDDを適用することで,識別超球の算出を行い,その中心との距離が最小となるように高解像度化の対象となる画像の未知の高周波成分を推定する.ここで,我々は画像の異なる階層間において局所画像が互いに類似する特徴に注目し,低解像度画像中の局所画像を教師データとして利用する.さらに,様々な種類のテクスチャを含む自然画像に対して高精度な高解像度化を可能とするため,提案手法では教師データとなる局所画像をあらかじめクラスタリングし,各クラスタについて得られる超球を用いて上記の未知の高周波成分の推定を行う.このとき,提案手法では各クラスタについて,推定される結果と超球の中心との距離に基づいて定義される確率の下,最終出力を決定する.その結果,テクスチャの種類に応じた未知の高周波成分の推定が可能となり,高精度な画像の高解像度化が期待できる.本文の最後では,提案手法の有効性を示すため,実画像を用いた比較実験を行い,その性能の評価を行う., 一般社団法人電子情報通信学会, 日本語
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討
    瀧澤 誠, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 265, 268, 2009年01月28日
    本文では,超解像処理を用いて,手ぶれにより劣化した動画像を復元・高解像度化する手法を提案する.提案手法では,動画像の各フレームに対し,手ぶれの劣化関数であるPSF(Point Spread Function)を推定し,得られるPSFを用いてフレーム間における対応を算出する.さらに,手ぶれ方向への平滑化を抑制する重み係数を新たに導入した超解像処理を適用することで,ぶれ方向への過剰な平滑化が抑制された高精度な復元および高解像度化を実現する.本文の最後では,比較実験を行い,提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 位相回復手法を用いた静止画像の高解像度化に関する一考察
    平松 朋樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 261, 264, 2009年01月28日
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像の高解像度化手法を提案する.提案手法では,まず,低解像度画像における自己相関関数に対して相関値の補間処理を施すことで,高解像度画像における自己相関関数を推定する.このとき,Wiener-Khintchineの定理により,推定された高解像度画像の自己相関関数をフーリエ変換することで,高解像度画像におけるフーリエ振幅を得ることが可能となるため,これをERアルゴリズムにおけるフーリエ領域の拘束条件として導入する.さらに,低解像度画像から得られる周波数成分を高解像度画像における既知の低周波成分とし,これを画像領域における拘束条件として導入する.以上のようにして導出されるERアルゴリズムを用いてフーリエ位相の回復を行うことで,失われた高周波成分が自己相関関数の補間により生成され,低解像度画像のみから高解像度画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像における選手位置および撮像されたフィールド領域の推定に関する一考察
    林 原局, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 229, 232, 2009年01月28日
    本稿では,2つのパーティクルフィルタを用いることで,サッカー映像から選手位置および撮像されたフィールド領域を高精度に推定する手法を提案する.提案手法では,サッカー映像における選手の位置を推定するパーティクルフィルタおよびサッカー映像を撮像しているカメラのパラメータを推定するパーティクルフィルタを定義する.このとき,各パーティクルフィルタにより得られる推定結果を互いの観測モデルへ導入し,それぞれ状態遷移を行うことにより選手位置およびフィールド領域の高精度な推定を可能とする., 一般社団法人電子情報通信学会, 日本語
  • パーティクルフィルタの拡張に関する検討 : 動画像のフロー推定への応用
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 157, 162, 2009年01月28日
    本文では,パーティクルフィルタを拡張し,ヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,互いに影響を与える2つの状態変数を含む状態遷移モデル,および一時刻前の観測が影響を与える観測モデルを用いる.これらのモデルを従来のパーティクルフィルタで用いる場合,従来法の仮定である,現時刻の状態変数の値が一時刻前の自身の値に従属すること,および現時刻の観測の値が現時刻の状態変数の値に従属することを満たさない.そのため,上述のモデルを満たす仮定を新たに用いることで,パーティクルフィルタを拡張する.さらに本文では,拡張したパーティクルフィルタをヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,2つの状態変数を順方向および逆方向のフローとして,それぞれの状態遷移モデルをフローの性質に基づいて定義する.また,勾配法および平行移動を表す成分に注目して拡張したヘルムホルツ分解定理のモデルを用いて,観測モデルおよび観測密度を定義する.これらの定義に基づくパーティクルフィルタでは,一時刻前の推定誤差の影響を受けない,輝度値の勾配,回転,発散,および平行移動に基づくフロー推定が可能である.その結果,高精度なフロー推定法が実現される., 一般社団法人電子情報通信学会, 日本語
  • 映像の特徴に注目した Web 映像検索手法の高精度化 : 正準相関分析を用いたコミュニティ抽出に関する一検討
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 93, 96, 2009年01月28日
    本文では,映像の特徴に注目した高精度なWeb映像検索手法を提案する.提案手法では,まず映像信号から得られる画像特徴及び音響特徴,映像を含むWebページのテキストから得られるテキスト特徴に対して正準相関分析を施すことで,新変量の空間における異なる特徴間での映像の類似度定義を可能とする.さらに,各映像の特徴をそれぞれ一つのWebページとみなし,得られる類似度に基づいた隣接行列の生成を行なう.その結果,提案手法では隣接行列にリンク解析を施すことで,類似した内容を含む映像の集合であるコミュニティの抽出が可能となり,映像の特徴に注目した効果的な映像検索が実現される., 一般社団法人電子情報通信学会, 日本語
  • 3次元ウェーブレットによる誤り耐性動画像符号化法とエラーコンシールメント法に関する一考察
    金 善美, 田中 宏和, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 108, 424, 47, 51, 2009年01月28日
    無線伝送に適した3次元ウェーブレットによる誤り耐性動画像符号化法とそのエラーコンシールメント技術について検討する。本文において我々は、各動画像フレームを空間方向にウェーブレット変換したとき、近隣のウェーブレット係数は相関性が存在することに着目する。そこで、提案手法では係数を複数グループに分散的にグループ化した後、これらのグループ毎に時間方向のウェーブレット変換を行う新たな符号化法を導入する。さらに、受信側においてこれらのグループの複数が伝送路誤りによって欠落した際においても効率良く補間可能なエラーコンシールメント法を提案する。本文の最後では、評価実験により提案方式の有効性を確認する。, 一般社団法人電子情報通信学会, 英語
  • A gender identification using shoeprint images
    Asamizu Satoshi, Haseyama Miki, 電子情報通信学会技術研究報告. IE, 画像工学, 108, 373, 209, 212, 2009年01月05日
    This paper proposes a gender identification using shoeprint images. It is difficult for the proposed method to identify an individual if shoeprint images for identification leaked out. Because the proposed method identifies gender without the faces, the type of dress and the hair types images. Therefore we can use safely the proposed method in public place. In addition, a sensor mat which we developed is reasonable to use mechanical switches arranged in a matrix pattern without pressure switches. We had shoeprint images with the sensor mat. We measure feature parameters from shoeprint images. The feature parameters are length, width and area of shoeprint. Utilizing the feature parameters, we identified, gender. In order to verify the gender identification rate of the proposed method, we set up the sensor mat at an entrance of buildings and took shoeprint images of 100 men and 100 women. As a result, we achieved about 86 percent of the gender identification rate., 一般社団法人電子情報通信学会, 英語
  • アクティブグリッドを用いたサッカー映像におけるパス可能領域の推定に関する検討
    高橋翔, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, 2009年
  • 顕微鏡画像からのアポトーシス細胞抽出における誤検出低減に関する考察
    稲垣潤, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2009, 2009年
  • A WEB COMMUNITY-BASED VIDEO RETRIEVAL METHOD USING CANONICAL CORRELATION ANALYSIS
    Yasutaka Hatakeyama, Takahiro Ogawa, Satoshi Asamizu, Miki Haseyama, 2009 16TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1-6, 805, +, 2009年
    This paper presents a Web community-based video retrieval method using canonical correlation analysis (CCA). In the proposed method, two novel approaches are introduced into the retrieval scheme of video materials on the Web. First, the CCA is applied to three kinds of video features, visual and audio features of video materials and textual features obtained from Web pages containing those video materials. This approach provides a solution of problems of traditional methods of not being able to calculate similarities between different kinds of video features. Furthermore, from the obtained similarities and link relationships of Web pages, a new adjacency matrix is defined, and link analysis can be applied to this matrix. Then, the Web communities of the video materials whose topics are similar to each other can be automatically extracted based on their features. Therefore, by ranking the video materials in the obtained Web community, accurate video retrieval can be realized., IEEE, 英語
  • AN EFFECTIVE FLOW ESTIMATION METHOD WITH PARTICLE FILTER BASED ON HELMHOLTZ DECOMPOSITION THEOREM
    Norihiro Kakukou, Takahiro Ogawa, Miki Haseyaam, 2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS, 949, 952, 2009年
    This paper proposes a novel flow estimation method with a particle filter based on a Helmholtz decomposition theorem. The proposed method extends a model of the Helmholtz decomposition theorem and enables the decomposition of flows into rotational, divergent, and translational components. From the extended model, the proposed method defines a state transition model and an observation model of the particle filter. Furthermore, the proposed method derives an observation density of the particle filter from an energy function based on the Helmholtz decomposition theorem. By utilizing these novel approaches, the proposed method provides a solution to the problem in the traditional ones of not being able to realize an effective flow estimation with the particle filter based on rotation, divergence, and translation, which are important geometric features. Consequently, the proposed method can accurately estimate the flows., IEEE, 英語
  • ADAPTIVE RECONSTRUCTION METHOD OF MISSING TEXTURES BASED ON KERNEL CANONICAL CORRELATION ANALYSIS
    Takahiro Ogawa, Miki Haseyama, 2009 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1- 8, PROCEEDINGS, 1165, 1168, 2009年
    This paper presents an adaptive reconstruction method of missing textures based on kernel canonical correlation analysis (CCA). The proposed method calculates the correlation between two areas, which respectively correspond to a missing area and its neighbor area, from known parts within the target image and realizes the estimation of the missing textures. In order to obtain this correlation, the kernel CCA is applied to each set containing the same kind of textures, and the optimal result is selected for the target missing area. Specifically, a new approach monitoring errors caused in the above estimation process enables the selection of the optimal result. This approach provides a solution to the problem in traditional methods of not being able to perform adaptive reconstruction of the target textures due to the missing intensities. Experimental results show subjective and quantitative improvement of the proposed reconstruction technique over previously reported reconstruction techniques., IEEE, 英語
  • Semantic image retrieval based on POCS algorithm using Kernel PCA and its performance verification
    Takahiro Ogawa, Miki Haseyama, Digest of Technical Papers - IEEE International Conference on Consumer Electronics, 582, 583, 2009年
    This paper presents a projection onto convex sets (POCS)-based semantic image retrieval method and its performance verification. The main contributions of the proposed method are twofold: introduction of nonlinear eigenspace of visual and semantic features into the constraint of the POCSbased semantic image retrieval algorithm and adaptive selection of the annotated images utilized for this algorithm. Then, by combining these two approaches, the semantic features of the query image are successfully estimated, and accurate image retrieval can be expected. Finally, relationship between the performance of the proposed method and the kinds of the kernel functions utilized for the kernel PCA is shown in this paper. ©2009 IEEE., 英語
  • Accurate graph-based scene segmentation using object matching and audio feature
    Makoto Yamamoto, Miki Haseyama, Digest of Technical Papers - IEEE International Conference on Consumer Electronics, 639, 640, 2009年
    A method for accurate scene segmentation utilizing two kinds of directed graph obtained by object matching and by using audio features is proposed. Generally, in audiovisual materials, there are repeated appearances of shots that include frames of the same background, object or place. It should be assumed that such shots are included in a single scene. In the proposed method, by performing object matching between two frames that are each included in different shots, multiple shots for which frames include the same object can be successfully found and their repeated appearances are represented as a directed graph. The proposed method also generates another directed graph that represents the repeated appearances of shots with similar audio features. By the combined use of these two graphs, accurate scene segmentation can be realized. The effectiveness of the proposed method is verified by applying this method to news programs and another broadcast program. ©2009 IEEE., 英語
  • A new image retrieval interface and its practical use in "view search Hokkaido"
    Miki Haseyama, Toshifumi Murata, Hisashi Ukawa, Digest of Technical Papers - IEEE International Conference on Consumer Electronics, 851, 852, 2009年
    New image retrieval technology, which is used for a service demonstration project "View Search Hokkaido" in "Information Grand Voyage Project" conducted by Ministry of Economy, Trade and Industry, Japan, is presented in this paper. The new technology enables image retrieval based on low-level features without utilizing any tag-based scheme and realizes a 3D interface for image retrieval. This 3D interface can provide new user experience, which has not been provided by the conventional retrieval services. The effectiveness of the 3D interface has been verified in "View Search Hokkaido". ©2009 IEEE., 英語
  • A Study on Multi-carrier CDMA with Adaptive Trellis Coded Modulation
    Hirokazu Tanaka, Shoichiro Yamasaki, Miki Haseyama, 2009 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATION SYSTEMS (ISPACS 2009), 477, +, 2009年
    A Generalized Symbol-rate-increased (GSRI) Pragmatic Adaptive Trellis Coded Modulation (ATCM) applied to a Multi-carrier CDMA system with bi-orthogonal keying is analyzed. In [7], an efficient ATCM scheme using GSRI-TCM has been proposed. However, since the modulation and coding selection is based on the ideal SNR estimation method, performance evaluations employing practical channel estimation scheme is desired.
    In this paper, we investigate the performance of the Multi-carrier CDMA with GSRI ATCM employing practical SNR estimation. The performance evaluations on a multi-path fading channel are presented., IEEE, 英語
  • WARP-AEC: A Stereo Acoustic Echo Canceller based on W-Adaptive Filters for Rapid Projection
    Shigenobu Minami, Hirokazu Tanaka, Miki Haseyama, 2009 INTERNATIONAL SYMPOSIUM ON INTELLIGENT SIGNAL PROCESSING AND COMMUNICATION SYSTEMS (ISPACS 2009), 299, +, 2009年
    It is difficult for stereo acoustic echo cancellers to converge toward real stereo echo path characteristics in the case of strong cross-channel correlation in right and left channel signals. To overcome this problem, we propose the WARP (W-Adaptive filters for Rapid Projection) method, which uses a monaural adaptive filter in parallel with a stereo adaptive filter. In this method, stereo echo path estimation is realized by projecting from two monaural estimated echo path characteristics at a far-end talker change. Stereo echo path estimation error, which is gradually decreased in conventional methods, is quickly improved at a far-end talker change by adopting the WARP method. This method has been evaluated by using 5 talker position's stereo signals with /without 10% level drift in right and left channels. The results showed that there was a 15-20dB improvement in estimation error at a far-end talker change compared with estimation errors in conventional methods, such as MC-NLMS and Affine projection method with p=3 in the case of WGN, and that there were more than 10 dB echo path estimation error improvement and 20-30 dB residual echo level improvement in the case of voice source., IEEE, 英語
  • Error correction scheme for multi-carrier CDMA with bi-orthogonal modulation
    Hirokazu Tanaka, Shoichiro Yamasaki, Miki Haseyama, 2008 International Symposium on Information Theory and its Applications, ISITA2008, 1061, +, 2008年12月01日
    In order to reduce out-of-band emission and PAPR for Multi-carrier (MC) CDMA system, bi-orthogonal modulation is one of the efficient schemes. However the performance of the scheme rapidly degrades if Hadamard code selection errors are occurred at the receiver. We propose and examine a frequency domain error correction scheme for the system employing Reed-Solomon (RS) code. This basic concept is that a Forward Error Correction (FEC) code corrects the code selection errors for all the subcarriers. An efficient decoding method that not only code selection error but the transmitted bit error can correct is also examined., IEEE, 英語
  • 誤差伝搬の抑制を目的としたカルマンフィルタによる動画像のエラーコンシールメント手法に関する検討
    高橋茂樹, 小川貴弘, 田中宏和, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, ROMBUNNO.0137, 2008年10月25日
    日本語
  • 映像特徴量に注目したWeb映像検索手法の提案
    畠山泰貴, 小川貴弘, 浅水仁, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, ROMBUNNO.0126, 2008年10月25日
    日本語
  • SIFT特徴に基づく投票による類似パターン抽出に関する考察
    角野公亮, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, ROMBUNNO.0125, 2008年10月25日
    日本語
  • 撮像物体の自動抽出を可能とするSVMの実現に関する一考察
    岡田周史, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, ROMBUNNO.0136, 2008年10月25日
    日本語
  • 動画像における歩行者識別のための処理対象領域の設定に関する一考察
    陳宇, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, ROMBUNNO.0135, 2008年10月25日
    日本語
  • Low complexity speaker identification in AAC domain (メディア工学)
    Ai Haojun, Haseyama Miki, 映像情報メディア学会技術報告, 32, 46, 31, 34, 2008年10月23日
    This paper presents an implementation of a low-complexity speaker identification algorithm working in the compressed audio domain. The goal is to perform speaker modeling and identification without decoding the AAC bitstream to extract speaker dependent features, thus saving important system resource. The silence detection and MFCC parameters are calculated from MDCT coefficient other than from the FFT spectrum. Each speaker is modeled by a GMM, which is trained using the EM algorithm to refine the weight and the parameters of each component. The recognition accuracies of our algorithm reach 97% for ARCTIC database with 16% CPU overload comparing to the algorithms based on the analysis of the decoded PCM signals., 一般社団法人映像情報メディア学会, 英語
  • パーティクルフィルタによるフローの推定に関する検討 : 観測モデルへのヘルムホルツ分解定理の導入
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 32, 46, 19, 22, 2008年10月23日
    本文では,ヘルムホルツ分解定理に着眼したパーティクルフィルタによるフロー推定法を提案する.ヘルムホルツ分解定理を用いた従来法では,平行移動および過去に推定されたフローの推定誤差を考慮していないため,その推定性能が低下する場合が存在する.そこで提案手法では,平行移動に注目して,ヘルムホルツ分解定理のモデルを拡張する.これにより,平行移動を考慮したフローの推定が可能となり,その推定性能の向上が期待できる.さらに提案手法では,パーティクルフィルタの状態変数をフローとし,一時刻前のフレームの各画素におけるフローが現時刻のフレームの各画素におけるフローへ推移する過程を状態遷移モデルで定義する.また,以下に示す2つの過程を観測モデルとして定義する.1つ目は,現時刻のフレーム中の各画素におけるフローからそのフレーム中の各画素における輝度値が生成され,雑音が重畳する過程である.2つ目は,現時刻のフレーム中の各画素におけるフローがヘルムホルツ分解定理により回転成分および発散成分に分解され,雑音が重畳する過程である.それらのモデルに基づくパーティクルフィルタを用いることで,提案手法では一時刻前のフレーム中の各画素におけるフローの推定誤差の影響を受けずに現時刻のフレーム中の各画素におけるフローを推定することが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • リンク解析に基づく Web ページ中に存在する画像の類似度算出に関する検討
    村山 聖太, 長谷山 美紀, 映像情報メディア学会技術報告, 32, 46, 23, 26, 2008年10月23日
    本文では,リンク解析に基づくWebページ中に存在する画像の類似度算出法を提案する.我々は,共通の内容を含むWebページの集合において,リンク関係の存在するWebページ中の画像には共通の内容を含む領域が存在し,かつそれらの領域における画像特徴は類似していると仮定する.この仮定に基づき,提案手法では共通の内容を含む領域の画像特微量に注目した類似度を新たに定義する.新たに定義した類似度を用いることで,画像に異なる内容を含む領域が存在する場合に適切な類似度算出が困難である従来の問題が解決され,高精度な画像検索の実現が期待できる., 一般社団法人映像情報メディア学会, 日本語
  • 超解像処理に基づく動画像の高解像度化および高フレームレート化に関する一検討 : 特徴点の対応に注目したクラスタリングの導入
    瀧澤 誠, 長谷山 美紀, 映像情報メディア学会技術報告, 32, 46, 27, 30, 2008年10月23日
    本文では,超解像処理を用いて動画像の高解像度化および高フレームレート化を行う手法を提案する.提案手法では,フレーム間における画素の対応を,複数の特徴点の対応に基づき得られる射影変換のパラメータで表す.このとき,特徴点の対応をクラスタリングし,最大のクラスタを構成する特徴点の対応から射影変換のパラメータを求めることで,動物体が複数存在する場合にも高精度なカメラパラメータの推定を実現する.その結果,連続する既知のフレームとそれらの間に存在する未知のフレームとの画素の対応を推定し,さらに超解像処理を適用することで,動画像の高精細な高解像度化および高フレームレート化か可能となる.本文の最後では,比較実験を行い,提案手法の有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • POCS-based annotation method using kernel PCA for semantic image retrieval
    Takahiro Ogawa, Miki Haseyama, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E91A, 8, 1915, 1923, 2008年08月
    A projection onto convex sets (POCS)-based annotation method for semantic image retrieval is presented in this paper. Utilizing database images previously annotated by keywords, the proposed method estimates unknown semantic features of a query image from its known visual features based on a POCS algorithm, which includes two novel approaches. First, the proposed method semantically assigns database images to some clusters and introduces a nonlinear eigenspace of visual and semantic features in each cluster into the constraint of the POCS algorithm. This approach accurately provides semantic features for each cluster by using its visual features in the least squares sense. Furthermore, the proposed method monitors the error converged by the POCS algorithm in order to select the optimal cluster including the query image. By introducing the above two approaches into the POCS algorithm, the unknown semantic features of the query image are successfully estimated from its known visual features. Consequently, similar images can be easily retrieved from the database based on the obtained semantic features. Experimental results verify the effectiveness of the proposed method for semantic image retrieval., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • 幾何モデルに基づく映像からの人数推定
    新井 啓之, 宮川 勲, 小池 秀樹, 長谷山 美紀, 映像情報メディア学会技術報告, 32, 26, 33, 36, 2008年06月23日
    デジタルサイネージの広告効果測定への適用を想定した,混雑時にも適用可能でかつ簡易な初期設定で利用可能な映像からの人数推定方法を提案する.本手法では,各画素が実空間の人物表面上でどのくらいの面積を占めるかを考慮することにより,画素から人数への変換係数を定義する.そして入力画像において検出された前景画素に沿ってこの変換係数を積算することにより推定人数を得る.局所的な処理結果の単純な積算として人数を推定できるため,混雑時においても安定な処理が可能となる.また処理に必要な幾何パラメータは,人の平均身長など先験的知識から決定されるものとカメラ校正により取得できるもののみであり,カメラ校正を行っておけばカメラ毎の細かなチューニングは不要となる.実画像を用いた実験により本手法の妥当性を確認した., 一般社団法人映像情報メディア学会, 日本語
  • MC-CDMAにおける周波数方向誤り訂正符号化法に関する一検討 (スマートインフォメディアシステム)
    田中 宏和, 蒋 慶雲, 山崎 彰一郎, 長谷山 美紀, 電子情報通信学会技術研究報告, 108, 85, 65, 70, 2008年06月12日
    CDMAとOFDMを組み合わせたMulti-carrier(MC)CDMAシステムは移動通信環境における高速伝送に効果的なシステムである。一方でハードウェアによる実現を考えると、ハイパワーアンプ(HPA)の非線形特性によって生じる帯域外輻射やPAPRの影響を出来るだけ少なくするため、HPAの特性は通常高い線形性が要求される。これらの問題を解決する手段の1つとしてbi-orthogonal変調を用いる方式が提案されている。 bi-orthogonal変調を適用したMC-CDMAの誤りを考えた場合、受信機におけるsign bit復調誤りよりもHadamard符号語の符号選択誤りの方が影響が大きいという特徴がある。本論文では、周波数方向にReed-Solomon(RS)符号化を行うことで、効率よく符号選択誤りを低減する方式を提案する。更に受信機側でRS復号結果を相関復調装置にフィードバックすることで、sign bitのビット誤り率も合わせて低減できることを示す。そして、これら提案方式について理論解析とシミュレーションによる特性評価を行う。, 一般社団法人電子情報通信学会, 日本語
  • MC-CDMAにおける周波数方向誤り訂正符号化法に関する一検討
    田中 宏和, 蒋 慶雲, 山崎 彰一郎, 長谷山 美紀, 電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム, 108, 85, 65, 70, 2008年06月05日
    日本語
  • カルマンフィルタを用いたエラーコンシールメントに関する一検討 : 動画像の復号過程を表現した状態遷移モデルの実現
    高橋 茂樹, 小川 貴弘, 田中 宏和, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 487, 13, 18, 2008年02月19日
    本文では,カルマンフィルタを用いた動画像の高精度なエラーコンシールメント手法を提案する.提案手法では,カルマンフィルタの状態変数を動画像の各フレームにおける輝度値とみなし,以下の状態遷移モデルと観測モデルを設計することでエラーコンシールメントを実現する.まず,動きベクトルを用いることで,動画像の復号過程を表す状態遷移モデルを設計する.さらに,新たな劣化過程を導入した観測モデルを設計することで,カルマンゲインの算出を可能とし,状態遷移による推定値の補正を実現する.このように,新たな状態遷移モデルと観測モデルを導入することで,提案手法では最小二乗規範に基づいてカルマンフィルタによるエラーコンシールメントを行うことが可能となる.本文の最後では,実際にエラーを与えた動画像に対して提案手法を適用し,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • モーフィングに基づくフレーム補間に関する一検討 : 適応的な対応点推定における領域分割の高精度化
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 487, 19, 24, 2008年02月19日
    本稿では,適応的な対応点推定に基づくモーフィングを用いたフレーム補間法を提案する.提案手法では,フレーム補間を行う処理対象の2フレーム間において,エッジなどの特徴を対応付ける点を推定し,その対応点に基づいてモーフィングを行うことにより,補間フレームを生成する.対応点を推定する際には,処理対象フレームを動物体領域と背景領域に分割し,それぞれの領域に適した手法を用いることで,高精度な対応点の推定を可能とする.このとき,提案手法では領域分割処理において,一時刻前の補間フレームとその領域分割結果を用いて検証を行うことで,高精度な背景領域と動物体領域の推定を可能とする.さらに,提案手法では得られた対応点を用いて補間フレームを生成する際に,動物体領域と背景領域を異なる処理により補間することで,動物体と背景の境界付近において高精度な補間を行うことを可能とする., 一般社団法人電子情報通信学会, 日本語
  • マクロブロックの特徴を用いたクラスタリングに基づく適応内挿フィルタの設計に関する検討
    松野 孝也, 近藤 敏志, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 487, 25, 28, 2008年02月19日
    本文では,マクロブロックの特徴に着目したクラスタリングに基づく適応内挿フィルタ設計手法を提案する.提案手法では,マクロブロックについてそれらの動きベクトルに着目し,内挿フィルタにより補間される小数位置に基づいたクラスタリングを行う.さらに各クラスタごとに整数位置画素から小数位置画素を補間する内挿フィルタを最小二乗規範に基づき設計する.補間される位置に着目してクラスタリングを行い得られるクラスタごとに内挿フィルタを設計することで,得られるフィルタはフレーム内の水平方向と垂直方向における自己相関の差異を考慮することが可能となる.その結果,内挿フィルタを用いることで動き補償予測誤差を低減することが可能となり,符号化効率の向上が実現される., 一般社団法人電子情報通信学会, 日本語
  • 複数の検出器に基づく人物検出の高精度化に関する考察
    加賀 陽介, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 487, 51, 54, 2008年02月19日
    本文では,複数の検出器を用いることで動画像から高精度に人物を検出する手法を提案する.提案手法では,歩行者検出と顔検出の2種類の検出結果を2次元平面上へ投票し,最終的な人物検出結果を得る.これにより,種類の異なる検出結果が一つに統合され,単一の検出器では検出が困難となる場合でも高精度な人物検出が実現可能となる.本文の最後では提案手法を実画像に適用する実験を行い,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 色成分に着眼したレベルセット法を用いたサッカー映像における選手追跡に関する一検討
    林 原局, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 487, 67, 70, 2008年02月19日
    本稿では,レベルセット法を用いてサッカー映像中の選手を高精度に追跡する手法を提案する.提案手法では、レベルセット法における評価関数に,境界面が滑らかさを保つための特徴量に加え,選手のユニフォームの色成分に着眼した新たな特徴量を導入する.これにより提案手法では,異なるチームを区別した高精度な選手の追跡が可能となる., 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタを用いたエラーコンシールメントに関する一検討 : 動画像の復号過程を表現した状態遷移モデルの実現
    高橋 茂樹, 小川 貴弘, 田中 宏和, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 489, 13, 18, 2008年02月19日
    本文では,カルマンフィルタを用いた動画像の高精度なエラーコンシールメント手法を提案する.提案手法では,カルマンフィルタの状態変数を動画像の各フレームにおける輝度値とみなし,以下の状態遷移モデルと観測モデルを設計することでエラーコンシールメントを実現する.まず,動きベクトルを用いることで,動画像の復号過程を表す状態遷移モデルを設計する.さらに,新たな劣化過程を導入した観測モデルを設計することで,カルマンゲインの算出を可能とし,状態遷移による推定値の補正を実現する.このように,新たな状態遷移モデルと観測モデルを導入することで,提案手法では最小二乗規範に基づいてカルマンフィルタによるエラーコンシールメントを行うことが可能となる.本文の最後では,実際にエラーを与えた動画像に対して提案手法を適用し,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • モーフィングに基づくフレーム補間に関する一検討 : 適応的な対応点推定における領域分割の高精度化
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 489, 19, 24, 2008年02月19日
    本稿では,適応的な対応点推定に基づくモーフィングを用いたフレーム補間法を提案する.提案手法では,フレーム補間を行う処理対象の2フレーム間において,エッジなどの特徴を対応付ける点を推定し,その対応点に基づいてモーフィングを行うことにより,補間フレームを生成する.対応点を推定する際には,処理対象フレームを動物体領域と背景領域に分割し,それぞれの領域に適した手法を用いることで,高精度な対応点の推定を可能とする.このとき,提案手法では領域分割処理において,一時刻前の補間フレームとその領域分割結果を用いて検証を行うことで,高精度な背景領域と動物体領域の推定を可能とする.さらに,提案手法では得られた対応点を用いて補間フレームを生成する際に,動物体領域と背景領域を異なる処理により補間することで,動物体と背景の境界付近において高精度な補間を行うことを可能とする., 一般社団法人電子情報通信学会, 日本語
  • マクロブロックの特徴を用いたクラスタリングに基づく適応内挿フィルタの設計に関する検討
    松野 孝也, 近藤 敏志, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 489, 25, 28, 2008年02月19日
    本文では,マクロブロックの特徴に着目したクラスタリングに基づく適応内挿フィルタ設計手法を提案する.提案手法では,マクロブロックについてそれらの動きベクトルに着目し,内挿フィルタにより補間される小数位置に基づいたクラスタリングを行う.さらに各クラスタごとに整数位置画素から小数位置画素を補間する内挿フィルタを最小二乗規範に基づき設計する.補間される位置に着目してクラスタリングを行い得られるクラスタごとに内挿フィルタを設計することで,得られるフィルタはフレーム内の水平方向と垂直方向における自己相関の差異を考慮することが可能となる.その結果,内挿フィルタを用いることで動き補償予測誤差を低減することが可能となり,符号化効率の向上が実現される., 一般社団法人電子情報通信学会, 日本語
  • 複数の検出器に基づく人物検出の高精度化に関する考察
    加賀 陽介, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 489, 51, 54, 2008年02月19日
    本文では,複数の検出器を用いることで動画像から高精度に人物を検出する手法を提案する.提案手法では,歩行者検出と顔検出の2種類の検出結果を2次元平面上へ投票し,最終的な人物検出結果を得る.これにより,種類の異なる検出結果が一つに統合され,単一の検出器では検出が困難となる場合でも高精度な人物検出が実現可能となる.本文の最後では提案手法を実画像に適用する実験を行い,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 色成分に着眼したレベルセット法を用いたサッカー映像における選手追跡に関する一検討
    林 原局, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 489, 67, 70, 2008年02月19日
    本稿では,レベルセット法を用いてサッカー映像中の選手を高精度に追跡する手法を提案する.提案手法では、レベルセット法における評価関数に,境界面が滑らかさを保つための特徴量に加え,選手のユニフォームの色成分に着眼した新たな特徴量を導入する.これにより提案手法では,異なるチームを区別した高精度な選手の追跡が可能となる., 一般社団法人電子情報通信学会, 日本語
  • メロディーに着眼した類似度に基づく類似楽曲抽出の精度に関する一考察
    小林 和也, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 486, 49, 53, 2008年02月18日
    本文では,我々が以前に提案した楽曲間の相違度算出手法を楽曲データベースに適用し,類似楽曲抽出を行うことでその有効性の評価を行う.この手法では,楽曲のメロディーの推移に着眼した特徴量を算出し,得られる特徴量に対してDynamic Time Warpingを適用することで楽曲間の相違度の算出を可能とした.ただし,以前我々が精度評価のために行った実験では,数曲の楽曲を用いた相違度算出に留まっており,類似楽曲抽出の十分な検証を行っていなかった.そこで,本文では284曲で構成される楽曲データベースを用いて評価実験を行い,類似楽曲抽出の精度について考察する.さらに,他手法との比較を行い,本手法の有効性について検討を行う., 一般社団法人電子情報通信学会, 日本語
  • 映像検索のための画像及び音響信号によるシーン間の相違度定義に関する検討
    道山 大悟, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 486, 55, 59, 2008年02月18日
    本稿では,映像検索のための画像及び音響信号に基づくシーン間の相違度定義を行う手法を提案する.提案手法では,シーン間の任意の2ショットにおいて,画像特徴量,音響特徴量,及びそれらを統合して得られた特徴量を比較し,最も類似した特徴量に対しDynamic Time Warpingを施すことによりシーン間の相違度を算出する.この際,正準相関分析を用いて得られる写像により画像特徴量と音響特徴量を同一の特徴空間にて表し,この特徴空間にて特徴量の比較を行う.新たな特徴空間は,映像から得られる画像特徴量と音響特徴量の相関が最大となるような写像を用いて定義されるため,画像信号と音響信号に含まれる共通の特徴に着目した比較が可能となる.これにより,提案手法ではシーン間で類似した特徴量を適切に選択することで,高精度なシーン間の相違度算出を実現する.本稿の最後では,提案手法により得られる相違度を用いてシーン検索の実験を行うことで,その有効性を評価する., 一般社団法人電子情報通信学会, 日本語
  • 映像の構造に基づいたシーン分割に関する一検討 : 動画像信号と音響信号の協調利用によるアプローチ
    山本 誠, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 486, 61, 66, 2008年02月18日
    本文では,動画像信号と音響信号の両者の繰り返し構造に基づき,映像信号のシーン分割を行う手法を提案する.提案手法では,映像信号のショットに対して,動画像信号と音響信号から得られる特徴量を用いてクラスタリングを行い,類似したショットの繰り返し構造をそれぞれ取得する.具体的に,これらの構造は,類似したショットを含むクラスタをノード,ショットの時間推移を辺とすることにより有向グラフで表現される.したがって,作成された二つの有向グラフの両者に対して,共通するカット辺を求めることで,二つの信号を有効に用いた映像信号のシーン分割が可能となる.その結果,提案手法は従来の動画像信号のみを用いたシーン分割法において発生するシーンの過分割の抑制を実現した., 一般社団法人電子情報通信学会, 日本語
  • カーネル主成分分析を用いた画像の意味的特徴量の推定法に関する考察 : 画像内容に基づいた類似画像検索のための一検討
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 107, 486, 67, 72, 2008年02月18日
    本文では,画像内容に基づく類似画像検索を実現するため,カーネル主成分分析を用いた画像の意味的特徴量の推定手法を提案する.提案手法では,あらかじめキーワードが付与されているデータベース中の画像をクラスタリングし,各クラスタから得られる画像特徴量および意味的特徴量の非線形固有空間を用いて,新たな写像を導出する.このとき得られる写像は,同一のクラスタに属する画像に対して,その画像特徴量から意味的特徴量を高精度に推定する.そこで,提案手法ではキーワードが未知のクエリ画像に対して,その意味的特徴量を推定する際に画像特徴量で生じる誤差に注目することで,属するクラスタの適応的選択を行う.これにより,クエリ画像の意味的特徴量は最適なクラスタによって精度良く推定されるため,その結果から画像内容に基づいた類似画像検索を行うことが可能となる., 一般社団法人電子情報通信学会, 日本語
  • メロディーに着眼した類似度に基づく類似楽曲抽出の精度に関する一考察
    小林 和也, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 488, 49, 53, 2008年02月18日
    本文では,我々が以前に提案した楽曲間の相違度算出手法を楽曲データベースに適用し,類似楽曲抽出を行うことでその有効性の評価を行う.この手法では,楽曲のメロディーの推移に着眼した特徴量を算出し,得られる特徴量に対してDynamic Time Warpingを適用することで楽曲間の相違度の算出を可能とした.ただし,以前我々が精度評価のために行った実験では,数曲の楽曲を用いた相違度算出に留まっており,類似楽曲抽出の十分な検証を行っていなかった.そこで,本文では284曲で構成される楽曲データベースを用いて評価実験を行い,類似楽曲抽出の精度について考察する.さらに,他手法との比較を行い,本手法の有効性について検討を行う., 一般社団法人電子情報通信学会, 日本語
  • 映像検索のための画像及び音響信号によるシーン間の相違度定義に関する検討
    道山 大悟, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 488, 55, 59, 2008年02月18日
    本稿では,映像検索のための画像及び音響信号に基づくシーン間の相違度定義を行う手法を提案する.提案手法では,シーン間の任意の2ショットにおいて,画像特徴量,音響特徴量,及びそれらを統合して得られた特徴量を比較し,最も類似した特徴量に対しDynamic Time Warpingを施すことによりシーン間の相違度を算出する.この際,正準相関分析を用いて得られる写像により画像特徴量と音響特徴量を同一の特徴空間にて表し,この特徴空間にて特徴量の比較を行う.新たな特徴空間は,映像から得られる画像特徴量と音響特徴量の相関が最大となるような写像を用いて定義されるため,画像信号と音響信号に含まれる共通の特徴に着目した比較が可能となる.これにより,提案手法ではシーン間で類似した特徴量を適切に選択することで,高精度なシーン間の相違度算出を実現する.本稿の最後では,提案手法により得られる相違度を用いてシーン検索の実験を行うことで,その有効性を評価する., 一般社団法人電子情報通信学会, 日本語
  • 映像の構造に基づいたシーン分割に関する一検討 : 動画像信号と音響信号の協調利用によるアプローチ
    山本 誠, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 488, 61, 66, 2008年02月18日
    本文では,動画像信号と音響信号の両者の繰り返し構造に基づき,映像信号のシーン分割を行う手法を提案する.提案手法では,映像信号のショットに対して,動画像信号と音響信号から得られる特徴量を用いてクラスタリングを行い,類似したショットの繰り返し構造をそれぞれ取得する.具体的に,これらの構造は,類似したショットを含むクラスタをノード,ショットの時間推移を辺とすることにより有向グラフで表現される.したがって,作成された二つの有向グラフの両者に対して,共通するカット辺を求めることで,二つの信号を有効に用いた映像信号のシーン分割が可能となる.その結果,提案手法は従来の動画像信号のみを用いたシーン分割法において発生するシーンの過分割の抑制を実現した., 一般社団法人電子情報通信学会, 日本語
  • カーネル主成分分析を用いた画像の意味的特徴量の推定法に関する考察 : 画像内容に基づいた類似画像検索のための一検討
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 488, 67, 72, 2008年02月18日
    本文では,画像内容に基づく類似画像検索を実現するため,カーネル主成分分析を用いた画像の意味的特徴量の推定手法を提案する.提案手法では,あらかじめキーワードが付与されているデータベース中の画像をクラスタリングし,各クラスタから得られる画像特徴量および意味的特徴量の非線形固有空間を用いて,新たな写像を導出する.このとき得られる写像は,同一のクラスタに属する画像に対して,その画像特徴量から意味的特徴量を高精度に推定する.そこで,提案手法ではキーワードが未知のクエリ画像に対して,その意味的特徴量を推定する際に画像特徴量で生じる誤差に注目することで,属するクラスタの適応的選択を行う.これにより,クエリ画像の意味的特徴量は最適なクラスタによって精度良く推定されるため,その結果から画像内容に基づいた類似画像検索を行うことが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 複数の検出器に基づく人物検出の高精度化に関する考察 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    加賀 陽介, 長谷山 美紀, 映像情報メディア学会技術報告, 32, 10, 51, 54, 2008年02月
    映像情報メディア学会, 日本語
  • QUALITY ESTIMATION OF FRACTAL CODED IMAGES BASED ON IMAGE FEATURES
    Takezawa Megumi, Sanada Hirofumi, Watanabe Kazuhisa, HASEYAMA Miki, 電子情報通信学会技術研究報告. IE, 画像工学, 107, 411, 289, 293, 2008年01月07日
    Fractal image coding is one of the coding techniques used for digital images. It can provide the decoded images with a higher quality than the JPEG compression at ultra low bit-rates. However, we cannot adopt it practically. One of the reasons is that the decoded images are sometimes low quality. Moreover, what is more inconvenient is that we cannot know the decoded image quality of a given image unless we actually encode and decode it which takes a lot of time. Therefore, in this paper, we have investigated the relationship between the quality of the decoded image and various features of the image. By finding the important features which relate to the image quality, we can estimate the decoded image quality in a short amount of time without actually encoding the image., 一般社団法人電子情報通信学会, 英語
  • 次世代映像検索を考える-Cyber Space Navigator-
    長谷山美紀, 映情学平成19年度メディア工学シンポジウム (Mar.), 2008年
  • 映像中に撮像された物体の幾何学的特徴に着眼したシーン分割手法の高精度化に関する一検討
    山本誠, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, 2008年
  • モーフィングを用いたフレーム補間の改良-特徴点の高精度な対応付けによる検討-
    瀧澤誠, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, 2008年
  • ファジィクラスタリングを用いた音響シーン分割の高精度化に関する考察-音響シーンに対する新たな特徴量の定義-
    成田容, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, 2008年
  • 色ヒストグラムを用いた類似画像分類の高速化に関する検討
    徳本了太, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2008, 2008年
  • Media distribution and processing
    Kazuto Kamikura, Miki Haseyama, Kazuhito Murakami, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 62, 8, 1251, 1254, 2008年
    Inst. of Image Information and Television Engineers, 日本語
  • A Kalman filter based restoration method for in-vehicle camera images in foggy conditions
    Tomoki Hiramatsu, Takahiro Ogawa, Miki Haseyama, 2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12, 1245, 1248, 2008年
    This paper proposes a Kalman filter based restoration method for images obtained by in-vehicle camera in foggy conditions. The proposed method introduces two novel approaches into the Kalman filter based restoration. The first one is an automatic determination of a fog deterioration model. A vanishing point in the foggy image is estimated by using cross ratio of lane marking, and automatic determination of all parameters of the fog deterioration model is realized. Furthermore, the obtained model is introduced into the Kalman filter. Specifically, our method regards each frame as a state variable and its observation model is defined by the fog deterioration model. Then, since the correlation between successive frame can be effectively utilized by the Kalman filter, the accurate restoration of foggy images is achieved. Experimental results show that the proposed method achieves higher performance than the traditional method based on the fog deterioration model., IEEE, 英語
  • Kernel PCA-based resolution enhancement approach of still images using different levels of pyramid structure
    Takahiro Ogawa, Miki Haseyama, 2008 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING, VOLS 1-12, 1293, 1296, 2008年
    This paper presents a kernel PCA-based adaptive resolution enhancement method of still images. The proposed method introduces two novel approaches into the kernel PCA-based reconstruction of high-frequency components missed from a high-resolution (HR) image. First, since local images between two different resolution levels of a pyramid structure are similar to each other, nonlinear eigenspaces of local images in the target low-resolution (LR) image are utilized as those of local images in the HR image. Further, in the kernel PCA-based reconstruction process of the high-frequency components, our method monitors errors caused in the known low-frequency components and realizes the selection of the optimal eigenspace. Then, since the missing high-frequency components can be adaptively estimated, the accurate HR image can be obtained., IEEE, 英語
  • Two-phased region integration approach for effective pedestrian detection in low contrast images
    Miki Haseyama, Yosuke Kaga, 2008 DIGEST OF TECHNICAL PAPERS INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 384, 385, 2008年
    An accurate pedestrian detection method is proposed, which is effective especially in low-contrast images. The pedestrian detection method generally consists of two serial functions: One is moving object extraction, and the other is pedestrian decision. In particular, the moving objects need to be extracted precisely for the accurate pedestrian detection. However, since the moving objects are extracted as multiple small regions when the image contrast is low, the pedestrian detection often fails. To overcome this problem, the proposed method integrates the separated moving objects by two-phased region integration. In the first phase, the pieces of the moving objects are integrated by applying the watershed algorithm. Then, these regions are, in the second phase, further integrated by watching the outputs of support vector machines for the pedestrian detection. By using these integration schemes, the moving objects are appropriately extracted, and thereby the accurate pedestrian detection can be realized., IEEE, 英語
  • A KALMAN FILTER-BASED APPROACH FOR ADAPTIVE RESTORATION OF IN-VEHICLE CAMERA FOGGY IMAGES
    Tomoki Hiramatsu, Takahiro Ogawa, Miki Haseyama, 2008 15TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1-5, 3160, 3163, 2008年
    In this paper, a Kalman filter-based approach for adaptive restoration of video images acquired by an in-vehicle camera in foggy conditions is proposed. In order to realize Kalman filter-based restoration, the proposed method regards the intensities in each frame as elements of the state variable of the Kalman filter and designs the following two models for restoration of foggy images. The first one is an observation model, which represents a fog deterioration model. The second one is a non-linear state transition model, which represents the target frame in the original video image from its previous frame based on motion vectors. By utilizing the observation and state transition models, the correlation between successive frames can be effectively utilized for restoration. Further, the proposed method introduces a new estimation scheme of the parameter, which determines the deterioration characteristic in foggy conditions, into the Kalman filter algorithm. Consequently, since automatic determination of the fog deterioration model, which specifies the observation model, from only the foggy images is realized, the accurate restoration can be achieved. Experimental results show that the proposed method has better performance than that of the traditional method based on the fog deterioration model., IEEE, 英語
  • Performance Improvement of CMA Based FM Multipath Cancelling System in Automobile Application
    Masaichi Akiho, Tsuguhide Aoki, Kiyonori Takahashi, Miki Haseyama, ICSP: 2008 9TH INTERNATIONAL CONFERENCE ON SIGNAL PROCESSING, VOLS 1-5, PROCEEDINGS, 2670, 2673, 2008年
    Constant Modulus Algorithm (CMA) is widely applied to improve distorted transmitting radio signal at the receiver. FM radio is still very popular equipment for in-car entertainment. Therefore, correcting FM multi-path distortion on conventional FM radio system is one of the greatly expected applications of CMA technique. In this paper, we discuss performance and improvement of the CMA based FM multi-path cancelling system in automobile application by demonstrating influence of impulse noise, which is very common in vehicle environment. Impulse noise, which is received at antenna, will not be corrected at all before it goes into CMA based multi-path canceling system as the input. the impulse noise on CMA input will make the system unstable so easily. Proposing limit error signal CAM, we can successfully achieve to avoid influence of the impulse noise., IEEE, 英語
  • KERNEL PCA-BASED SEMANTIC FEATURE ESTIMATION APPROACH FOR SIMILAR IMAGE RETRIEVAL
    Takahiro Ogawa, Miki Haseyama, 2008 15TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1-5, 965, 968, 2008年
    A kernel PCA-based semantic feature estimation approach for similar image retrieval is presented in this paper. Utilizing database images previously annotated by keywords, the proposed method estimates unknown semantic features of a query image. First, our method performs semantic clustering of the database images and derives a new map from a nonlinear eigenspace of visual and semantic features in each cluster. This map accurately provides the semantic features for the images belonging to each cluster by using their visual features. Further, in order to select the optimal cluster including the query image, the proposed method monitors errors of the visual features caused by the semantic feature estimation process. Then, even if any semantics of the query image are unknown, its semantic features are successfully estimated by the optimal cluster. Experimental results verify the effectiveness of the proposed method for semantic image retrieval., IEEE, 英語
  • <bold>Estimating the Number of People in a Video Sequence via Geometrical Model</bold>
    Hiroyuki Arai, Isao Miyagawa, Hideki Koike, Miki Haseyama, 19TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION, VOLS 1-6, 3823, 3826, 2008年
    We propose a novel technique for estimating the number of people in a video sequence; it has the advantages of being stable even in crowded situations and needing no ground-truth data. By analyzing the geometrical relationships between image pixels and their intersection volumes in the real world quantitatively a foreground image can be directly indicate the number of people. Because foreground detection can be done even in crowded situations, the proposed method can be applied to such situations. Also it can estimate the number of people in an a-priori manner so it needs no ground-truth data which is necessary for existing feature-based estimating techniques. Experiments show the validity of the proposed method., IEEE, 英語
  • AN EFFECTIVE DETECTION METHOD OF ROTATIONAL AND DIVERGENT STRUCTURES IN STILL IMAGES BASED ON HELMHOLTZ DECOMPOSITION
    Norihiro Kakukou, Takahiro Ogawa, Miki Haseyama, 2008 15TH IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1-5, 2336, 2339, 2008年
    This paper proposes a novel detection method of rotational and divergent structures in still images based on Helmholtz decomposition. These structures are mathematical features in vector analysis. Traditionally, some detection methods of these structures in image sequences have been proposed. By using the Helmholtz decomposition, which can decompose flows into rotational and divergent components, the traditional methods can detect these structures in image sequences. However, the rotational and divergent structures in still images cannot be detected with the traditional methods. Therefore, the proposed method introduces a new criterion into the traditional schemes in order to realize the detection of the rotational and divergent structures in still images. This criterion is derived from two properties based on relation between still images and the flows, which are composed of the rotational and divergent components. Consequently, the detection of the rotational and divergent structures in still images can be achieved., IEEE, 英語
  • Image recognition method using intensity gradient vectors
    Masao Hiramoto, Takahiro Ogawa, Miki Haseyama, Systems and Computers in Japan, 38, 13, 15, 27, 2007年11月30日
    This paper proposes a method for general image recognition based on the progress of increasing the pixels of image sensors and improving image quality. This method can also adapt to images which have undergone geometric transformations such as the rotation and movement of images. The proposed method uses a voting system that utilizes vectors. This method uses vectors which represent intensity gradients and vectors which show position to express images and also defines voting vectors and similarity for the recognition. In addition, the proposed method has characteristics of concentrating voting locations at an origin point if there are identical images such that the voting results do not influence geometric transformations. When we performed experiments on natural images including original images which may have undergone image processing such as Gaussian or median filtering and JPEG compression, we understood that distinct differences appeared in the similarities and that recognition was possible even if an artificial process was added to the images. Even further, when we examined recognition of images using the greatest number of voting points as an application of this method, we were able to show that the recognition capability was high and that a partial image contained in one image could also be recognized. © 2007 Wiley Periodicals, Inc., 英語
  • クラスタリング手法 Dynamic Coalescence Model の離散化による相対的に不変である位置におけるクラスタの代表点の発見
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 107, 360, 1, 6, 2007年11月22日
    本論文では,クラスタリング手法Dynamic Coalescence Model (DCM)で発見されるクラスタの代表点を,相対的に不変である位置に発見する手法を提案する. DCMでは,点が球で表され,場の概念に基づいて,球を動かして接触した球を凝縮することが繰り返される.凝縮後の球はクラスタの代表点を表す.しかし,球の位置や移動変位は連続値で表される.そのため,球が凝縮される位置を越えて動かされる場合があった.その上,球の移動距離は,他の球から受ける引力の総和の大きさに比例する値である.そのため,単峰であるクラスタの代表点が,その重心から遠い位置に発見される場合が多かった.提案手法では,点が質点で表され,その位置が離散値で表され,質点の移動変位はその加速度を量子化したベクトルで表される.点分布から,その特徴を表し,相対的な位置が不変である,代表点の分布が生成される.本論文では,提案手法の射影や領域分割,文字認識などへの応用の可能性も示す., 一般社団法人電子情報通信学会, 日本語
  • 位相と分布推定の利用による2次元2値点分布の3次識別系の改良
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 107, 360, 7, 12, 2007年11月22日
    移動,回転,拡縮パターンの識別に,観測面の画素3個で表される三角形の相似関係を用いる3次系は有用である.しかし,類似するパターンで,相対的な位置が同じ三角形に,相似でないものがある.そのため,識別率の改善に,識別されるクラスが既知である学習パターンが多数必要であった.本論文で提案する2次元2値点分布の識別系では,まず,学習パターンから,その類似パターンにも共通する特徴を表す類似パターンを生成し,これも学習パターンにする.次に,学習パターンを,統計的に推測されるその類似パターンも表す特徴ベクトルに変換する.特徴ベクトルは,2点の相対的な距離や位置向きを表す.さらに,その特徴ベクトルから,その統計的な特徴を表す特徴ベクトルも生成する.学習パターンが3個与えられると,文字や混合分布の識別率は飽和することを確認する., 一般社団法人電子情報通信学会, 日本語
  • クラスタリング手法 Dynamic Coalescence Model の離散化による相対的に不変である位置におけるクラスタの代表点の発見
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 107, 359, 1, 6, 2007年11月22日
    本論文では,クラスタリング手法Dynamic Coalescence Model (DCM)で発見されるクラスタの代表点を,相対的に不変である位置に発見する手法を提案する. DCMでは,点が球で表され,場の概念に基づいて,球を動かして接触した球を凝縮することが繰り返される.凝縮後の球はクラスタの代表点を表す.しかし,球の位置や移動変位は連続値で表される.そのため,球が凝縮される位置を越えて動かされる場合があった.その上,球の移動距離は,他の球から受ける引力の総和の大きさに比例する値である.そのため,単峰であるクラスタの代表点が,その重心から遠い位置に発見される場合が多かった.提案手法では,点が質点で表され,その位置が離散値で表され,質点の移動変位はその加速度を量子化したベクトルで表される.点分布から,その特徴を表し,相対的な位置が不変である,代表点の分布が生成される.本論文では,提案手法の射影や領域分割,文字認識などへの応用の可能性も示す., 一般社団法人電子情報通信学会, 日本語
  • 位相と分布推定の利用による2次元2値点分布の3次識別系の改良
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 107, 359, 7, 12, 2007年11月22日
    移動,回転,拡縮パターンの識別に,観測面の画素3個で表される三角形の相似関係を用いる3次系は有用である.しかし,類似するパターンで,相対的な位置が同じ三角形に,相似でないものがある.そのため,識別率の改善に,識別されるクラスが既知である学習パターンが多数必要であった.本論文で提案する2次元2値点分布の識別系では,まず,学習パターンから,その類似パターンにも共通する特徴を表す類似パターンを生成し,これも学習パターンにする.次に,学習パターンを,統計的に推測されるその類似パターンも表す特徴ベクトルに変換する.特徴ベクトルは,2点の相対的な距離や位置向きを表す.さらに,その特徴ベクトルから,その統計的な特徴を表す特徴ベクトルも生成する.学習パターンが3個与えられると,文字や混合分布の識別率は飽和することを確認する., 一般社団法人電子情報通信学会, 日本語
  • 霧の劣化特性を考慮した車載カメラ画像の高精度な復元に関する一考察
    平松朋樹, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2007, ROMBUNNO.206, 2007年10月27日
    日本語
  • ヘルムホルツ分解定理に基づく静止画像の回転構造および発散構造の検出に関する検討 (メディア工学)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 47, 1, 4, 2007年10月
    映像情報メディア学会, 日本語
  • カーネル主成分分析に基づいた静止画像の適応的高解像度化に関する考察--異なる階層間の相関に着眼した非線形固有空間の推定 (メディア工学)
    小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 47, 5, 8, 2007年10月
    映像情報メディア学会, 日本語
  • IFSによるインパルス性雑音により劣化した画像の復元手法--ブロック領域分割を用いた改良のアプローチ (メディア工学)
    西村 浩哉, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 47, 9, 12, 2007年10月
    映像情報メディア学会, 日本語
  • ベクトル量子化に基づく適応内挿フィルタ係数の符号化に関する考察 (メディア工学)
    松野 孝也, 近藤 敏志, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 47, 19, 22, 2007年10月
    映像情報メディア学会, 日本語
  • 超解像処理を用いた高解像度な補間フレームの生成手法に関する検討 (メディア工学)
    瀧澤 誠, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 47, 23, 26, 2007年10月
    映像情報メディア学会, 日本語
  • 男女識別のための足跡画像取得システムの構築 (メディア工学)
    浅水 仁, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 47, 51, 54, 2007年10月
    映像情報メディア学会, 日本語
  • POCS-Based texture reconstruction method using clustering scheme by kernel PCA
    Takahiro Ogawa, Milki Haseyama, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E90A, 8, 1519, 1527, 2007年08月
    A new framework for reconstruction of missing textures in digital images is introduced in this paper. The framework is based on a projection onto convex sets (POCS) algorithm including a novel constraint. In the proposed method, a nonlinear eigenspace of each cluster obtained by classification of known textures within the target image is applied to the constraint. The main advantage of this approach is that the eigenspace can approximate the textures classified into the same cluster in the least-squares sense. Furthermore, by monitoring the errors converged by the POCS algorithm, a selection of the optimal cluster to reconstruct the target texture including missing intensities can be achieved. This POCS-based approach provides a solution to the problem in traditional methods of not being able to perform the selection of the optimal cluster due to the missing intensities within the target texture. Consequently, all of the missing textures are successfully reconstructed by the selected cluster's eigenspaces which correctly approximate the same kinds of textures. Experimental results show subjective and quantitative improvement of the proposed reconstruction technique over previously reported reconstruction techniques., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • 霧発生時に撮像された車載カメラ画像の高精度な復元に関する考察 : 霧の劣化モデルのカルマンフィルタへの適用
    平松 朋樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 107, 100, 1, 6, 2007年06月21日
    本文ではカルマンフィルタを用い,霧の影響により劣化した車載カメラ画像を高精度に復元する手法を提案する.提案手法では,霧発生時に車載カメラにより撮像された画像からレーンマーキング等の複比を用いた消失点の推定を行うことで,霧の劣化モデルにおけるパラメータの自動設定を可能とする.さらに,パラメータが自動設定された霧の劣化モデルをカルマンフィルタの観測モデルにおける観測方程式として用いる.また,状態遷移モデルとして動画像に対して動きベクトルを用いたフレーム間での輝度値の推定とその誤差を補正するモデルを導入する.これにより提案手法では,隣接するフレーム間の相関を用いた高精度な復元が実現される., 一般社団法人電子情報通信学会, 日本語
  • 霧発生時に撮像された車載カメラ画像の高精度な復元に関する考察 : 霧の劣化モデルのカルマンフィルタへの適用
    平松 朋樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理, 107, 104, 1, 6, 2007年06月14日
    本文ではカルマンフィルタを用い,霧の影響により劣化した車載カメラ画像を高精度に復元する手法を提案する.提案手法では,霧発生時に車載カメラにより撮像された画像からレーンマーキング等の複比を用いた消失点の推定を行うことで,霧の劣化モデルにおけるパラメータの自動設定を可能とする.さらに,パラメータが自動設定された霧の劣化モデルをカルマンフィルタの観測モデルにおける観測方程式として用いる.また,状態遷移モデルとして動画像に対して動きベクトルを用いたフレーム間での輝度値の推定とその誤差を補正するモデルを導入する.これにより提案手法では,隣接するフレーム間の相関を用いた高精度な復元が実現される., 一般社団法人電子情報通信学会, 日本語
  • 霧発生時に撮像された車載カメラ画像の高精度な復元に関する考察 : 霧の劣化モデルのカルマンフィルタへの適用
    平松 朋樹, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 107, 102, 1, 6, 2007年06月14日
    本文ではカルマンフィルタを用い,霧の影響により劣化した車載カメラ画像を高精度に復元する手法を提案する.提案手法では,霧発生時に車載カメラにより撮像された画像からレーンマーキング等の複比を用いた消失点の推定を行うことで,霧の劣化モデルにおけるパラメータの自動設定を可能とする.さらに,パラメータが自動設定された霧の劣化モデルをカルマンフィルタの観測モデルにおける観測方程式として用いる.また,状態遷移モデルとして動画像に対して動きベクトルを用いたフレーム間での輝度値の推定とその誤差を補正するモデルを導入する.これにより提案手法では,隣接するフレーム間の相関を用いた高精度な復元が実現される., 一般社団法人電子情報通信学会, 日本語
  • 動画像のモーフィングによるフレーム補間の高精度化--コントロールポイントの設定に関する一検討
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告, 106, 535, 1, 4, 2007年02月23日
    本文では,モーフィングを用いた高精度なフレーム補間法を提案する.提案手法では,動画像の各フレーム間において撮像物体の対応付けを行い,得られる対応を用いてモーフィングを行うことで補間フレームを生成する.モーフィングにより高精度な中間画像を生成するためには,撮像物体の特徴を考慮する必要がある.そこで,提案手法は,各フレームにおいて撮像物体の特徴点を抽出し,得られる特徴点に基づいて対応付けを行う.これにより,撮像物体の適切な対応付けを実現し,高精度な補間フレームの生成を可能とする.本文の最後では,提案手法を実際の動画像に適用し,高精度なフレーム補間結果が得られたので,それを報告する., 一般社団法人電子情報通信学会, 日本語
  • バスケットボール映像における高精度な選手位置推定のための一考察
    佐久間 大輔, 長谷山 美紀, 電子情報通信学会技術研究報告, 106, 535, 17, 22, 2007年02月23日
    本稿では,バスケットボール映像において高精度に選手位置を推定する手法を提案する.提案手法では,色ヒストグラムを基に動物体を追跡するMean-Shift法を利用する.このとき,隣接フレームにおける各選手の追跡結果からオクルージョンの影響を受けた選手を特定する処理をMean-Shift法に導入する.さらに,提案手法ではこのような選手を安定して追跡するために,オクルージョン発生以降のフレームにおいて,発生前と色ヒストグラムが類似する領域を探索する.これにより,オクルージョンに対し頑強な選手追跡が実現され,選手位置の高精度な推定が可能となる.本稿の最後では,提案手法を実際に放送されたバスケットボール映像へ適用し,その有効性について評価を行う., 一般社団法人電子情報通信学会, 日本語
  • 動画像のモーフィングによるフレーム補間の高精度化 : コントロールポイントの設定に関する一検討
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 537, 1, 4, 2007年02月16日
    本文では,モーフィングを用いた高精度なフレーム補間法を提案する.提案手法では,動画像の各フレーム間において撮像物体の対応付けを行い,得られる対応を用いてモーフィングを行うことで補間フレームを生成する.モーフィングにより高精度な中間画像を生成するためには,撮像物体の特徴を考慮する必要がある.そこで,提案手法は,各フレームにおいて撮像物体の特徴点を抽出し,得られる特徴点に基づいて対応付けを行う.これにより,撮像物体の適切な対応付けを実現し,高精度な補間フレームの生成を可能とする.本文の最後では,提案手法を実際の動画像に適用し,高精度なフレーム補間結果が得られたので,それを報告する., 一般社団法人電子情報通信学会, 日本語
  • バスケットボール映像における高精度な選手位置推定のための一考察
    佐久間 大輔, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 537, 17, 22, 2007年02月16日
    本稿では,バスケットボール映像において高精度に選手位置を推定する手法を提案する.提案手法では,色ヒストグラムを基に動物体を追跡するMean-Shift法を利用する.このとき,隣接フレームにおける各選手の追跡結果からオクルージョンの影響を受けた選手を特定する処理をMean-Shift法に導入する.さらに,提案手法ではこのような選手を安定して追跡するために,オクルージョン発生以降のフレームにおいて,発生前と色ヒストグラムが類似する領域を探索する.これにより,オクルージョンに対し頑強な選手追跡が実現され,選手位置の高精度な推定が可能となる.本稿の最後では,提案手法を実際に放送されたバスケットボール映像へ適用し,その有効性について評価を行う., 一般社団法人電子情報通信学会, 日本語
  • ネオコグニトロンを用いた類似画像分類の高精度化に関する一考察 : 色特徴量を抽出する新たな機構の導入
    大原 貴都, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 106, 534, 1, 6, 2007年02月15日
    本文では,データベース中の画像を自動で分類する手法の提案を行う.これまでに我々は,画像の構造に基づいた特徴量として主にエッジに着目し,ニューラルネットワークの一つであるネオコグニトロンに入力することで,類似した画像の分類を実現した.しかしながら,この手法で用いられる特徴量は,撮像方向が異なる場合等において変化しやすく,同一の対象を撮像した画像であっても,異なるクラスタに分類される可能性がある.そこで,本文では画像のエッジと色情報に基づいた分類手法を提案する.色情報の一つである色ヒストグラムは,撮像方向の変化に影響を受けにくい特徴量として知られている.したがって,提案手法では画像の色ヒストグラムを特徴量とした自己組織化マップによる分類を行う.さらに,得られた分類結果に基づいてネオコグニトロンにおける最終層の構造を適応的に変更することで,画像のエッジに加え,色情報を考慮した高精度な分類を可能とする.本文の最後では,提案手法の有効性を示すために実験を行い,その分類性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • エッジを考慮した類似画像分類の高精度化に関する考察
    渡辺 隆志, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 106, 534, 7, 10, 2007年02月15日
    本稿では,データベース中に含まれる画像を類似した画像の集合に分類する手法を提案する.以前我々は,画像を色ヒストグラム間の2次形式距離に基づいて分類し,さらに画像の構図に着目することで分類結果の高精度化を図る手法を提案した.しかしながら,予め定義した少数の構図のみを用いていたため,画像中の色の分布について十分に考慮することができず,異なる被写体を撮像した画像であっても,同一の集合に分類されてしまうことが確認された.そこで本稿では,画像中のより詳細な色分布に着目した新たな類似画像分類手法を導入する.提案手法では,画像中の色分布について考慮することが可能である色コリログラムを用い,K-means法により画像の分類を行う.さらに,エッジとその周辺画素の色に着目した再分類処理を施すことで,より高精度な類似画像分類を実現する., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるグループ戦術解析のための一考察
    今 宏史, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 106, 534, 121, 124, 2007年02月15日
    本稿では,サッカー映像において,戦術上関連がある選手のグループに対して解析を行うことで,チームが優勢な度合(以降,グループ優勢度)を算出する手法を提案する.提案手法ではまず,選手をグループに分類する.そして,各グループにおいて,選手間が有する戦術的な関係を選手の位置関係に基づいて推定する.選手の関係がわかれば,各選手の戦術上の役割や状況などがわかる.このことから,グループ内の選手の関係を評価することでどちらのチームが戦術上優位な状況にいる選手が多いのかを推定できる.したがって,提案手法では選手の関係に基づいてグループ優勢度を算出する.提案手法によってグループ優勢度を算出し,可視化することで,視聴者の試合内容の理解を補助することや,戦術的な観点からのインデキシングの実現が期待できる., 一般社団法人電子情報通信学会, 日本語
  • メロディーとリズムに着眼した音楽信号の類似度に関する一考察
    今野 聡司, 二反田 直己, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 106, 534, 125, 128, 2007年02月15日
    本稿では,楽曲中のリズムに着眼し,楽曲間の類似度を算出する新たな手法を提案する.提案手法では,音楽信号より算出される自己相関関数により楽曲のリズムを表現し,DTWを適用することで類似度を算出する.これにより,楽曲のリズムに基づく適切な類似度算出を可能とする.さらに,提案手法は,メロディーに基づく楽曲間の類似度を併せて用いることで,類似度の可視化を試みる.これにより,提案手法の類似楽曲検索への応用を検討する., 一般社団法人電子情報通信学会, 日本語
  • エッジの連続性を考慮したIFSに基づく画像の拡大に関する検討
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 106, 534, 129, 134, 2007年02月15日
    本文では,Iterated Function System(IFS)に基づく画像拡大法を提案する.提案手法では,従来のIFS画像拡大法で問題となるエッジの不連続を抑制するため,IFSの拡大処理の過程にラインプロセスを導入する.ラインプロセスはエッジの連続性に注目して,その位置を推定する手法であるが,画像の全ての輝度値が既知である場合に適用可能であり,輝度値が未知である拡大後の画像には適用できない.したがって提案手法では,拡大対象画像にラインプロセスを適用して取得されるエッジから拡大後の画像のエッジを推定し,得られるエッジに基づき,IFSの再構成処理で拡大後の画像の輝度値を算出する.その結果,得られる画像では,エッジの不連続が抑制される.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • リンク解析に基づくクラスタリング結果を利用したHITSの改善に関する一考察
    武吉 朋也, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 106, 534, 159, 164, 2007年02月15日
    本文では,リンク構造の類似性に着目したHITSの改善法を提案する.HITSは,リンク構造の解析によりWebページに対してスコア付けを行う代表的手法であり,その改善手法も種々提案されている.しかしながら,従来手法では個人または一つの団体が作成したWebページと,これをコピーしたページ,さらにはこれらからリンクを張られているページのみが高いスコアを得るという問題が存在する.そこで,提案手法ではスコア付けの対象となるWebページの集合に対し,予め各Webページがもつリンク構造の類似性に着目したクラスタリングを行う.得られたクラスタにはある一つの団体が作成したページと,そのコピーが含まれる可能性が高い.従って,同じクラスタに属する複数のWebページと,一つのWebページの間にリンクが多数存在する場合に,これらのリンクの重みを減少させ,スコア付けを行う.これにより,従来手法ではスコアを得やすいリンク構造をもつWebページが高いスコアを得ることが抑制され,提案手法では様々な検索目的や好みをもつユーザの要求に応えることが可能となる.本文の最後では,提案手法の有用性を示すため比較実験を行う., 一般社団法人電子情報通信学会, 日本語
  • ネオコグニトロンを用いた類似画像分類の高精度化に関する一考察 : 色特徴量を抽出する新たな機構の導入
    大原 貴都, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 536, 1, 6, 2007年02月15日
    本文では,データベース中の画像を自動で分類する手法の提案を行う.これまでに我々は,画像の構造に基づいた特徴量として主にエッジに着目し,ニューラルネットワークの一つであるネオコグニトロンに入力することで,類似した画像の分類を実現した.しかしながら,この手法で用いられる特徴量は,撮像方向が異なる場合等において変化しやすく,同一の対象を撮像した画像であっても,異なるクラスタに分類される可能性がある.そこで,本文では画像のエッジと色情報に基づいた分類手法を提案する.色情報の一つである色ヒストグラムは,撮像方向の変化に影響を受けにくい特徴量として知られている.したがって,提案手法では画像の色ヒストグラムを特徴量とした自己組織化マップによる分類を行う.さらに,得られた分類結果に基づいてネオコグニトロンにおける最終層の構造を適応的に変更することで,画像のエッジに加え,色情報を考慮した高精度な分類を可能とする.本文の最後では,提案手法の有効性を示すために実験を行い,その分類性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • エッジを考慮した類似画像分類の高精度化に関する考察
    渡辺 隆志, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 536, 7, 10, 2007年02月15日
    本稿では,データベース中に含まれる画像を類似した画像の集合に分類する手法を提案する.以前我々は,画像を色ヒストグラム間の2次形式距離に基づいて分類し,さらに画像の構図に着目することで分類結果の高精度化を図る手法を提案した.しかしながら,予め定義した少数の構図のみを用いていたため,画像中の色の分布について十分に考慮することができず,異なる被写体を撮像した画像であっても,同一の集合に分類されてしまうことが確認された.そこで本稿では,画像中のより詳細な色分布に着目した新たな類似画像分類手法を導入する.提案手法では,画像中の色分布について考慮することが可能である色コリログラムを用い,K-means法により画像の分類を行う.さらに,エッジとその周辺画素の色に着目した再分類処理を施すことで,より高精度な類似画像分類を実現する., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるグループ戦術解析のための一考察
    今 宏史, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 536, 121, 124, 2007年02月15日
    本稿では,サッカー映像において,戦術上関連がある選手のグループに対して解析を行うことで,チームが優勢な度合(以降,グループ優勢度)を算出する手法を提案する.提案手法ではまず,選手をグループに分類する.そして,各グループにおいて,選手間が有する戦術的な関係を選手の位置関係に基づいて推定する.選手の関係がわかれば,各選手の戦術上の役割や状況などがわかる.このことから,グループ内の選手の関係を評価することでどちらのチームが戦術上優位な状況にいる選手が多いのかを推定できる.したがって,提案手法では選手の関係に基づいてグループ優勢度を算出する.提案手法によってグループ優勢度を算出し,可視化することで,視聴者の試合内容の理解を補助することや,戦術的な観点からのインデキシングの実現が期待できる., 一般社団法人電子情報通信学会, 日本語
  • メロディーとリズムに着眼した音楽信号の類似度に関する一考察
    今野 聡司, 二反田 直己, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 536, 125, 128, 2007年02月15日
    本稿では,楽曲中のリズムに着眼し,楽曲間の類似度を算出する新たな手法を提案する.提案手法では,音楽信号より算出される自己相関関数により楽曲のリズムを表現し,DTWを適用することで類似度を算出する.これにより,楽曲のリズムに基づく適切な類似度算出を可能とする.さらに,提案手法は,メロディーに基づく楽曲間の類似度を併せて用いることで,類似度の可視化を試みる.これにより,提案手法の類似楽曲検索への応用を検討する., 一般社団法人電子情報通信学会, 日本語
  • エッジの連続性を考慮したIFSに基づく画像の拡大に関する検討
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 536, 129, 134, 2007年02月15日
    本文では,Iterated Function System(IFS)に基づく画像拡大法を提案する.提案手法では,従来のIFS画像拡大法で問題となるエッジの不連続を抑制するため,IFSの拡大処理の過程にラインプロセスを導入する.ラインプロセスはエッジの連続性に注目して,その位置を推定する手法であるが,画像の全ての輝度値が既知である場合に適用可能であり,輝度値が未知である拡大後の画像には適用できない.したがって提案手法では,拡大対象画像にラインプロセスを適用して取得されるエッジから拡大後の画像のエッジを推定し,得られるエッジに基づき,IFSの再構成処理で拡大後の画像の輝度値を算出する.その結果,得られる画像では,エッジの不連続が抑制される.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • リンク解析に基づくクラスタリング結果を利用したHITSの改善に関する一考察
    武吉 朋也, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 106, 536, 159, 164, 2007年02月15日
    本文では,リンク構造の類似性に着目したHITSの改善法を提案する.HITSは,リンク構造の解析によりWebページに対してスコア付けを行う代表的手法であり,その改善手法も種々提案されている.しかしながら,従来手法では個人または一つの団体が作成したWebページと,これをコピーしたページ,さらにはこれらからリンクを張られているページのみが高いスコアを得るという問題が存在する.そこで,提案手法ではスコア付けの対象となるWebページの集合に対し,予め各Webページがもつリンク構造の類似性に着目したクラスタリングを行う.得られたクラスタにはある一つの団体が作成したページと,そのコピーが含まれる可能性が高い.従って,同じクラスタに属する複数のWebページと,一つのWebページの間にリンクが多数存在する場合に,これらのリンクの重みを減少させ,スコア付けを行う.これにより,従来手法ではスコアを得やすいリンク構造をもつWebページが高いスコアを得ることが抑制され,提案手法では様々な検索目的や好みをもつユーザの要求に応えることが可能となる.本文の最後では,提案手法の有用性を示すため比較実験を行う., 一般社団法人電子情報通信学会, 日本語
  • エッジを考慮した類似画像分類の高精度化に関する考察 (ヒューマンインフォメーション・メディア工学・映像表現&コンピュータグラフィックス)
    渡辺 隆志, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 10, 7, 10, 2007年02月
    映像情報メディア学会, 日本語
  • サッカー映像におけるグループ戦術解析のための一考察 (ヒューマンインフォメーション・メディア工学・映像表現&コンピュータグラフィックス)
    今 宏史, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 10, 121, 124, 2007年02月
    映像情報メディア学会, 日本語
  • メロディーとリズムに着眼した音楽信号の類似度に関する一考察 (ヒューマンインフォメーション・メディア工学・映像表現&コンピュータグラフィックス)
    今野 聡司, 二反田 直己, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 10, 125, 128, 2007年02月
    映像情報メディア学会, 日本語
  • エッジの連続性を考慮したIFSに基づく画像の拡大に関する検討 (ヒューマンインフォメーション・メディア工学・映像表現&コンピュータグラフィックス)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 10, 129, 134, 2007年02月
    映像情報メディア学会, 日本語
  • バスケットボール映像における高精度な選手位置推定のための一考察 (ヒューマンインフォメーション メディア工学 映像表現&コンピュータグラフィックス)
    佐久間 大輔, 長谷山 美紀, 映像情報メディア学会技術報告, 31, 11, 17, 22, 2007年02月
    映像情報メディア学会, 日本語
  • 動画像のモーフィングによるフレーム補間の高精度化 : コントロールポイントの設定に関する一検討
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. SDM, シリコン材料・デバイス, 106, 521, 1, 4, 2007年01月25日
    日本語
  • バスケットボール映像における高精度な選手位置推定のための一考察
    佐久間 大輔, 長谷山 美紀, 電子情報通信学会技術研究報告. SDM, シリコン材料・デバイス, 106, 521, 17, 22, 2007年01月25日
    日本語
  • サッカー映像における色成分を用いた選手追跡に関する検討
    林原局, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2007, 2007年
  • POCS-based iterative reconstruction algorithm of missing textures
    Takahiro Ogawa, Miki Haseyama, 2007 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1-7, 3, 1229, 1232, 2007年
    In this paper, a new framework for texture reconstruction of missing areas, which exist all over the target image, is presented. The framework is based on a projection onto convex sets (POCS) algorithm including a novel constraint. In the proposed method, a nonlinear eigenspace of each cluster obtained by texture classification is applied to the constraint. Furthermore, by monitoring the errors converged by the POCS algorithm, selection of the optimal cluster for the target texture including missing intensities is realized in order to reconstruct it adaptively. Then, iterating the POCS-based procedures, our method renews the nonlinear eigenspaces and the reconstruction image, and outputs the reliable result. This approach provides a solution to the problem in traditional methods of not being able to perform adaptive reconstruction of the target textures due to the missing intensities. Experimental results show subjective and quantitative improvement of the proposed reconstruction technique over previously reported reconstruction techniques., IEEE, 英語
  • Phase retrieval based on a snake for image reconstruction
    Keiko Kondo, Miki Haseyama, Hideo Kitajima, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E90D, 1, 283, 287, 2007年01月
    A new phase retrieval method using an active contour model (snake) for image reconstruction is proposed. The proposed method reconstructs a target image by retrieving the phase from the magnitude of its Fourier transform and the measured area of the image. In general, the measured area is different from the true area where the target image exists. Thus a snake, which can extract the shape of the target image, is utilized to renew the measured area. By processing this renewal iteratively, the area obtained by the snake converges to the true area and as a result the proposed method can accurately reconstruct a target image even when the measured area is different from the true area. Experimental results show the effectiveness of the proposed method., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • Audio-based shot classification for audiovisual indexing using PCA, MGD and fuzzy algorithm
    Naoki Nitanda, Miki Haseyama, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E90-A, 8, 1542, 1548, 2007年
    An audio-based shot classification method for audiovisual indexing is proposed in this paper. The proposed method mainly consists of two parts, an audio analysis part and a shot classification part. In the audio analysis part, the proposed method utilizes both principal component analysis (PCA) and Mahalanobis generalized distance (MGD). The effective features for the analysis can be automatically obtained by using PCA, and these features are analyzed based on MGD, which can take into account the correlations of the data set. Thus, accurate analysis results can be obtained by the combined use of PCA and MGD. In the shot classification part, the proposed method utilizes a fuzzy algorithm. By using the fuzzy algorithm, the mixing rate of the multiple audio sources can be roughly measured, and thereby accurate shot classification can be attained. Results of experiments performed by applying the proposed method to actual audiovisual materials are shown to verify the effectiveness of the proposed method. Copyright © 2007 The Institute of Electronics, Information and Communication Engineers., Institute of Electronics, Information and Communication, Engineers, IEICE, 英語
  • Players clustering based on graph theory for tactics analysis purpose in soccer videos
    Hirofumi Kon, Miki Haseyama, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E90-A, 8, 1528, 1533, 2007年
    In this paper, a new method for clustering of players in order to analyze games in soccer videos is proposed. The proposed method classifies players who are closely related in terms of soccer tactics into one group. Considering soccer tactics, the players in one group are located near each other. For this reason, the Euclidean distance between the players is an effective measurement for the clustering of players. However, the distance is not sufficient to extract tactics-based groups. Therefore, we utilize a modified version of the community extraction method, which finds community structure by dividing a non-directed graph. The use of this method in addition to the distance enables accurate clustering of players. © 2007 The Institute of Electronics, Information and Communication Engineers., Institute of Electronics, Information and Communication, Engineers, IEICE, 英語
  • Adaptive reconstruction method of missing texture based on projection onto convex sets
    Takahiro Ogawa, Miki Haseyama, 2007 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL I, PTS 1-3, PROCEEDINGS, 1, 697, 700, 2007年
    This paper presents a missing texture reconstruction method based on projection onto convex sets (POCS). The proposed method classifies textures within the target image into some clusters in a high-dimensional texture feature space. Further, for the target missing texture, our method performs a novel approach, that monitors the errors caused by the POCS algorithm in the feature space, and adaptively selects the optimal cluster including similar textures. Then, the missing texture is restored from these similar textures by a new POCS-based nonlinear subspace projection scheme. Consequently, since the proposed method realizes the nonconventional adaptive technique using the optimal nonlinear subspace, the accurate restoration result can be obtained. Experimental results show that our method achieves higher performance than the traditional method., IEEE, 英語
  • A new audio signal analyzer using PCA and MGD
    Naoki Nitanda, Miki Haseyama, ICCE: 2007 DIGEST OF TECHNICAL PAPERS INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 223, +, 2007年
    This paper presents a new audio signal analyzer Since our system can represent the possibility that the audio signal belongs to some audio classes, such as speech and music, it can be useful for several applications, such as audiovisual indexing and retrieval system., IEEE, 英語
  • Image authentication system based on two-dimensional matrix codes without contamination of original images
    Takahiro Ogawa, Miki Haseyama, ICCE: 2007 DIGEST OF TECHNICAL PAPERS INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 253, +, 2007年
    This paper proposes an authentication system without contamination of original images. The proposed system also realizes complete reconstruction of original signatures by introduction of 2-D matrix codes including error correction capability. Therefore, the system is suitable for the recent digital rights management., IEEE, 英語
  • 携帯電話を用いた救急救命のための情報提供システム
    小川 貴弘, 佐久間 大輔, 白石 真一, 長谷山 美紀, 映像情報メディア学会誌, 61, 12, 1818, 1827, 2007年
    We propose the use of a system that provides information about emergency rescue procedures for mobile phone users.To enable the users to easily understand the procedures,avatars demonstrate how they are used.Since the avatars are efficiently constructed on a subset of scalable vector graphics(SVG),they can be quickly transmitted to the mobile phone and with low computational loads.In addition to the avatars,complementary voice and text data that explainthe procedures are also transmitted via a synchronized multimedia integration language(SMIL, pronounced "smile") format.Moreover,to verify the performance and the effectiveness of the proposed system,we implemented a dedicated SMIL player suitable for use with mobile phones., 一般社団法人映像情報メディア学会, 日本語
  • Steady-state properties of a CORDIC-based adaptive ARMA lattice filter
    Shin'ichi Shiraishi, Miki Haseyama, Hideo Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E89A, 12, 3724, 3729, 2006年12月
    This paper analyzes the steady-state properties of a CORDIC-based adaptive ARMA lattice filter. In our previous study, the convergence properties of the filter in the non-steady state were clarified; however, its behavior in the steady state was not discussed. Therefore, we develop a distinct analysis technique based on a Markov chain in order to investigate the steady-state properties of the filter. By using the proposed technique, the relationship between step size and coefficient estimation error is revealed., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • A multi-objective service restoration method for power distribution systems
    Jun Inagaki, Jun Nakajima, Miki Haseyama, Proceedings - IEEE International Symposium on Circuits and Systems, 1784, 1787, 2006年12月01日
    Service restoration problem in distribution systems is formulated as a multi-objective optimization problem which is demanded not only for minimizing the amount of unrestored total loads but also for minimizing the number of the switching operations. The solution of the multi-objective optimization problem is usually obtained with a set of Pareto optimal solutions. The Pareto optimal solutions for the service restoration problem are useful for users to obtain their desired restoration by comparing a Pareto optimal solution with the others. However, the conventional methods cannot obtain several Pareto optimal solutions in one trial. Therefore, this paper proposes a method for obtaining the Pareto optimal set for the service restoration problem with a genetic algorithm. The genetic algorithm produces many possible solutions in its search process. By utilizing this feature, the proposed method can obtain the Pareto optimal set. © 2006 IEEE., IEEE
  • 動き補償予測誤差に基づく適応内挿フィルタ選択手法に関する考察
    松野 孝也, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 9, 12, 2006年10月30日
    映像情報メディア学会, 日本語
  • 色ヒストグラムを用いた類似画像分類に関する考察
    渡辺 隆志, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 37, 40, 2006年10月30日
    映像情報メディア学会, 日本語
  • オプティカルフローを用いた全方位動画像におけるカメラの移動方向推定に関する考察
    高橋 寛明, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 53, 56, 2006年10月30日
    映像情報メディア学会, 日本語
  • アクティブネットを用いたサッカー映像におけるパスコースの推定
    今 宏史, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 57, 60, 2006年10月30日
    映像情報メディア学会, 日本語
  • ネオコグニトロンを用いた類似画像分類に関する考察
    大原 貴都, 小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 61, 64, 2006年10月30日
    映像情報メディア学会, 日本語
  • 凸射影法を用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : 拘束条件に用いる局所画像の分類に関する検討
    小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 83, 86, 2006年10月30日
    映像情報メディア学会, 日本語
  • PCAを用いたオーディオ信号の分類法 : MGDを用いた分類の高精度化に関する一検討
    二反田 直己, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 91, 94, 2006年10月30日
    映像情報メディア学会, 日本語
  • 音楽信号におけるフレーズに着眼したメロディー検出に関する一考察
    今野 聡司, 二反田 直己, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 55, 95, 98, 2006年10月30日
    映像情報メディア学会, 日本語
  • IFSを用いたインパルス性雑音除去に関する一考察
    西村浩哉, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2006, ROMBUNNO.223, 2006年10月28日
    日本語
  • ウィナーフィルタを用いた霧の存在する画像の復元に関する一考察
    平松朋樹, 小川貴弘, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2006, ROMBUNNO.222, 2006年10月28日
    日本語
  • 拘束条件の適応的選択を導入した静止画像中に存在する消失テクスチャの再構成に関する検討
    小川 貴弘, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 42, 63, 66, 2006年08月31日
    映像情報メディア学会, 日本語
  • バスケットボール映像における選手位置推定に関する検討
    佐久間 大輔, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 42, 109, 112, 2006年08月31日
    映像情報メディア学会, 日本語
  • 動画像のフレーム補間に関する考察 : モーフィングを用いたアプローチ
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 106, 114, 1, 5, 2006年06月16日
    本文では,モーフィング技術を用いた動画像のフレーム補間法を提案する.提案手法では,動画像の隣接する2フレーム間に存在する動物体の対応を,フレーム間における動き推定の結果を用いて自動で設定する.さらに,得られる対応に基づきモーフィングを行い,フレーム補間を実現する.ある画像から異なる画像に滑らかに変化する過程の画像を生成することが可能なモーフィング技術を用いることで,提案手法では動物体が滑らかに変化する高精度な補間フレームを生成することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • ERアルゴリズムを用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : カーネル主成分分析を用いた新たな拘束条件の導入
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 106, 114, 7, 12, 2006年06月16日
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失領域の高精度な復元手法を提案する.我々はテクスチャ画像の特徴から,対象画像中の異なる位置に存在する局所領域間において,カーネル関数により高次元特徴空間へ写像される画像およびフーリエ振幅が互いに類似すると仮定する.さらに,復元対象領域の画像およびそのフーリエ振幅を高次元特徴空間へ写像した結果が,それぞれに対して対象画像から生成される固有空間内に存在するように,ERアルゴリズムの拘束条件を設定する.これにより,提案手法では復元対象領域に対して高精度なフーリエ振幅の算出および,その誤差が再構成領域に影響を与えにくい位相の回復を可能とし,消失領域の高精度な復元を実現する., 一般社団法人電子情報通信学会, 日本語
  • 動画像のフレーム補間に関する考察 : モーフィングを用いたアプローチ
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理, 106, 116, 1, 5, 2006年06月16日
    本文では,モーフィング技術を用いた動画像のフレーム補間法を提案する.提案手法では,動画像の隣接する2フレーム間に存在する動物体の対応を,フレーム間における動き推定の結果を用いて自動で設定する.さらに,得られる対応に基づきモーフィングを行い,フレーム補間を実現する.ある画像から異なる画像に滑らかに変化する過程の画像を生成することが可能なモーフィング技術を用いることで,提案手法では動物体が滑らかに変化する高精度な補間フレームを生成することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • ERアルゴリズムを用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : カーネル主成分分析を用いた新たな拘束条件の導入
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. SIP, 信号処理, 106, 116, 7, 12, 2006年06月16日
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失領域の高精度な復元手法を提案する.我々はテクスチャ画像の特徴から,対象画像中の異なる位置に存在する局所領域間において,カーネル関数により高次元特徴空間へ写像される画像およびフーリエ振幅が互いに類似すると仮定する.さらに,復元対象領域の画像およびそのフーリエ振幅を高次元特徴空間へ写像した結果が,それぞれに対して対象画像から生成される固有空間内に存在するように,ERアルゴリズムの拘束条件を設定する.これにより,提案手法では復元対象領域に対して高精度なフーリエ振幅の算出および,その誤差が再構成領域に影響を与えにくい位相の回復を可能とし,消失領域の高精度な復元を実現する., 一般社団法人電子情報通信学会, 日本語
  • 動画像のフレーム補間に関する考察 : モーフィングを用いたアプローチ
    山本 貴史, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 106, 112, 1, 5, 2006年06月16日
    本文では,モーフィング技術を用いた動画像のフレーム補間法を提案する.提案手法では,動画像の隣接する2フレーム間に存在する動物体の対応を,フレーム間における動き推定の結果を用いて自動で設定する.さらに,得られる対応に基づきモーフィングを行い,フレーム補間を実現する.ある画像から異なる画像に滑らかに変化する過程の画像を生成することが可能なモーフィング技術を用いることで,提案手法では動物体が滑らかに変化する高精度な補間フレームを生成することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • ERアルゴリズムを用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : カーネル主成分分析を用いた新たな拘束条件の導入
    小川 貴弘, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 106, 112, 7, 12, 2006年06月16日
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失領域の高精度な復元手法を提案する.我々はテクスチャ画像の特徴から,対象画像中の異なる位置に存在する局所領域間において,カーネル関数により高次元特徴空間へ写像される画像およびフーリエ振幅が互いに類似すると仮定する.さらに,復元対象領域の画像およびそのフーリエ振幅を高次元特徴空間へ写像した結果が,それぞれに対して対象画像から生成される固有空間内に存在するように,ERアルゴリズムの拘束条件を設定する.これにより,提案手法では復元対象領域に対して高精度なフーリエ振幅の算出および,その誤差が再構成領域に影響を与えにくい位相の回復を可能とし,消失領域の高精度な復元を実現する., 一般社団法人電子情報通信学会, 日本語
  • GMRFモデルを用いた静止画像における失われた輝度値の復元
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition), 89, 6, 1327, 1335, 2006年06月01日
    本論文では,GMRFモデルを用いた静止画像における失われた輝度値の復元手法を提案する.画像中に存在する輝度値消失領域を高精度に復元するためには,エッジ部を精度良く再構成する必要がある.そこで,我々はGMRFモデルを用いて,特に失われたエッジ部を高精変に復元する手法の実現を試みる.このとき,提案手法において用いられるGMRFモデルは,画像が複数の領域により構成され,各領域は弱定常な確率過程であるという仮定のもとで導出される.したがって,提案手法のモデルは画像中の異なる領域間でエッジの表現が可能となり,エッジ部において高精度な復元結果を与える.更に,・このモデルは輝度値消失領域に複数の領域が合まれ,それらが複数のエッジを構成する場合についても,その適用が可能であり,このような場合に従来手法が抱えていた問題である再構成されたエッジ部の過剰な平滑化が抑制される.本論文の最後では,提案手法の有効性を示すために実画像を用いた比較実験を行い,エッジ部における復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • Audio signal segmentation and classification using fuzzy c-means clustering
    Naoki Nitanda, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 37, 4, 23, 34, 2006年04月
    This paper proposes a method of segmentation and classification of audio signals which is coded by MPEG Audio. The proposed method first detects the boundaries between two different audio signals, which are called audio-cuts, and then classifies segments, which are called audio-segments, and uses audio-cuts detected by fuzzy c-means clustering their boundaries. Since conventional methods detect audio-cuts by applying thresholding to audio features such as energy and zero-crossing rate, misdetection often occurs when they are applied to an audio signal which contains several audio effects, such as fade-in, fade-out, cross-fade, and the like. The proposed method represents the possibility that the audio-cut exists by a real number from 0 to 1, obtained by using fuzzy c-means clustering
    all of the possible candidates for the audio-cuts are detected. Since audio effects which are difficult to detect by using conventional methods are also detected as the candidates, misdetection can be reduced. Furthermore, the audio-segments, whose boundaries are the candidates, are subdivided into five audio classes, which are silence, speech, music, speech with music background, and speech with noise background. By using the classification results, unnecessary audio-cuts can be removed, and thereby both accurate audio-cut detection and accurate audio-segment classification can be attained. © 2006 Wiley Periodicals, Inc., 英語
  • Filter coefficient quantization method with genetic algorithm, including simulated annealing
    M Haseyama, D Matsuura, IEEE SIGNAL PROCESSING LETTERS, 13, 4, 189, 192, 2006年04月
    A method based on a genetic algorithm (GA), including a simulated annealing (SA), is proposed for filter coefficient quantization. The proposed method uses the GA to search a population of the quantized filters of a digital filter for the optimal quantized filter. It retains the most accurate frequency characteristic of the original filter, which is either finite impulse response filter or an infinite impulse response filter. The initial population in the GA is generated by binomial distributions, which are not used for the other GAs. An SA is also embedded in the GA search, which can support the GA to converge to the optimum in the early generations. The experimental results verify that our method can provide a quantized filter with a better frequency characteristic than those obtained by the traditional quantization methods, such as rounding off, rounding up, and rounding down., IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 英語
  • Restoration of missing intensity of still images by using optical flow
    Takahiro Ogawa, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 37, 3, 49, 57, 2006年03月
    This paper proposes an accurate method for the restoration of missing intensities of still images by using the optical flow. It is important in restoration to reconstruct missing edges correctly. Therefore, this paper modifies the optical flow conventionally used for motion analysis in video images and applies it to the restoration of missing intensities. Further, the proposed method introduces a new index expressing the correlation of intensities between two pixels into the scheme for calculation of the optical flow in order to obtain a flow which gives more accurate estimated values. The optical flow calculated by this index provides the pixel from the neighborhood whose intensity is most similar to that of the target pixel, so that the estimated intensity is not affected by pixels whose intensities are quite different. Consequently, even when multiple edges pass through the missing area or the direction of the edge changes significantly inside the area, the proposed method can reconstruct the edges correctly. Some experimental results are presented in order to verify the high performance of the proposed method. © 2006 Wiley Periodicals, Inc., 英語
  • An extraction method for apoptotic cells from videomicroscopy images
    Miki Haseyama, Yukari Sasamura, Hideo Kitajima, Systems and Computers in Japan, 37, 3, 32, 40, 2006年03月
    An automatic extraction method for apoptotic cells from videomicroscopy images is proposed. The edges of the apoptotic cells in the microscopy images are gentle and thick because of the fluorescence enzyme used for the observation
    their shapes are distorted circles
    the apoptotic cells also neighbor on the other cells. Since the apoptotic cells cannot be easily extracted, they are generally extracted by visual recognition. Therefore, we propose a method to automatically extract only apoptotic cells based on shape features. The proposed method, in the first stage, extracts areas with strong possibilities that apoptotic cells are included. In the second stage, the method applies shape-feature analysis to the extracted areas. By using these two stages, the proposed method can accurately extract the apoptotic cells without increasing computational costs. Further, when videomicroscopy images are acquired as an image sequence, the proposed method can extract the cells more accurately by comparing the extraction results in neighboring frames. Simulation results verify the effectiveness of the proposed method. © 2006 Wiley Periodicals, Inc., 英語
  • ラインプロセスに着眼したIFSに基づくディジタル画像拡大法の高精度化に関する検討
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 14, 1, 6, 2006年02月21日
    映像情報メディア学会, 日本語
  • ERアルゴリズムを用いた消失テクスチャ再構成法の高精度化に関する考察 : ERアルゴリズムの拘束条件に用いる部分空間の検討
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 14, 7, 12, 2006年02月21日
    映像情報メディア学会, 日本語
  • 映像からの逆行者検知方法
    新井 啓之, 安野 貴之, 水上 緑, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 14, 29, 34, 2006年02月21日
    映像情報メディア学会, 日本語
  • 領域に依存したフィルタ設計による高品質な画像圧縮に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 14, 85, 88, 2006年02月21日
    日本語
  • 領域別適応処理によるセルアニメーション画像の高品質化
    山口 巧, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 14, 105, 108, 2006年02月21日
    映像情報メディア学会, 日本語
  • 共起を利用した学術論文の関連性の定量化とその可視化に関する一考察
    鎌倉 純一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 14, 127, 130, 2006年02月21日
    映像情報メディア学会, 日本語
  • 動画像へのフラクタル符号化の適用法に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀, 映像情報メディア学会技術報告, 30, 14, 131, 136, 2006年02月21日
    画像符号化手法の一つとして知られているフラクタル画像符号化は,画像の自己相似性を利用し,画像データを圧縮する.よって,得られる復号画像の品質は自己相似性と密接な関係があると考えられる.しかしながら,従来,この自己相似性と復号画質との関係について明らかにされてこなかった.そこで,以前我々は,これらの関係を明らかにするために,画像が持つ自己相似性の高さを表すための指標を示し,静止画像を対象として自己相似性と復号画質との関係について考察を行った.本文では,この自己相似性と復号画質との関係に基づき,フラクタル画像符号化の動画像への新たな適用法について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • ラインプロセスに着眼したIFSに基づくディジタル画像拡大法の高精度化に関する検討
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 609, 1, 6, 2006年02月21日
    本文では,Iterated Function System(IFS)に基づく画像拡大法を提案する.IFSでは原画像とはサイズが異なる画像を再構成することが可能である.この特徴を用いて,IFSによる画像拡大法が従来より提案されている.しかしながら,従来手法により拡大された画像では,IFSによる処理の最小単位であるレンジブロックの境界において輝度値の不連続,およびエッジの不連続が発生する.これは,従来手法が重ならないレンジブロックを用いていること,および隣接するレンジブロックの境界においてエッジの連続性を考慮せず処理を行っていることによる.そこで提案手法では,レンジブロックの境界における輝度値の不連続を抑制するため,レンジブロックを重なりを許して選択可能とする.さらに,拡大処理の過程にラインプロセスを導入する.このとき,ラインプロセスを用いて得られるエッジは連続性を持つことから,拡大画像においてエッジの連続性が保たれる.以上に示す提案手法を用いれば,高精細な拡大画像を得ることが可能となる.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • ERアルゴリズムを用いた消失テクスチャ再構成法の高精度化に関する考察 : ERアルゴリズムの拘束条件に用いる部分空間の検討
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 609, 7, 12, 2006年02月21日
    本文では,位相回復手法の一つであるER(Error Reduction)アルゴリズムを用いた静止画像中に存在する消失テクスチャの高精度な再構成法を提案する.提案手法ではERアルゴリズムで用いられる拘束条件を,復元対象領域およびそのフーリエ振幅がそれぞれ対象画像中の複数の局所領域およびそれらのフーリエ振幅から生成される二つの部分空間内に存在するように設定する.これにより,復元対象領域において未知であるフーリエ振幅および位相の推定が可能となり,消失領域の再構成が可能となる.さらに,提案手法では復元対象領域およびそのフーリエ振幅についてそれぞれ類似した局所領域とフーリエ振幅を選択し,これらを二つの部分空間の生成に用いている.これにより,得られる部分空間は復元対象領域に対して適応的に生成され,提案手法では高精度な消失テクスチャの再構成が可能となる.本文の最後では,提案手法の有効性を示すために実験を行い,その復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • 映像からの逆行者検知方法
    新井 啓之, 安野 貴之, 水上 緑, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 105, 609, 29, 34, 2006年02月21日
    指定された方向に逆らって歩行する逆行者を,斜め下向きに設置された一般的な監視カメラを利用して検知する手法を提案する。空港や駅など多くの人が通行している状況では,個人のトラッキングや単純なオプティカルフローの向きなどから逆行者を精度良く検知することは困難であり,雑踏の中で断片的に観測される逆行者を一連の動きとして検出する必要がある.この課題を解決するため,本手法では背景差分およびオプティカルフローの算出結果に基づき,ある瞬間tの左右方向の人物候補位置xとその移動方向を推定し,その結果をx-tマップに配置し, x-tマップ上でのハフ変換により一連の動きとして逆行を検知する.斜め下向きに設置されたカメラ映像を用いた実験を行い,本手法により逆行者を精度良く検知できることを確認した., 一般社団法人電子情報通信学会, 日本語
  • 領域に依存したフィルタ設計による高品質な画像圧縮に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 609, 85, 88, 2006年02月21日
    現在,DVD,ディジタル放送などのビデオ符号化方式として,MPEG-2が広く用いられている.MPEG-2は,ブロック単位での動き補償とDCTを用い,効率的に圧縮を実現している.しかしながら,低ビットレートで符号化を行った場合,復号画像にブロックひずみやリンギングなどの劣化が発生するという問題がある.そこで,以前我々は,これらの劣化を軽減するために,符号化側でフレームごとに符号化誤差を最小にする2次元FIRフィルタを設計し,その係数を符号に付加する手法を提案した.本文では,フィルタの設計をフレームごとではなく,復号画像のエッジの方向に注目して領域分割を行い,その領域ごとにフィルタ設計を行う手法を提案する.本提案手法を用いることで,従来手法と比較して,より高品質な画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 領域別適応処理によるセルアニメーション画像の高品質化
    山口 巧, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 609, 105, 108, 2006年02月21日
    動画配信のための映像符号化方式としてMPEG-4が広く用いられている.この符号化方式はブロック単位での動き補償および離散コサイン変換(DCT)を行い,DCT係数を量子化することで,効率的な圧縮を実現している.しかしながら,人工画像の一つである,セルアニメーション画像は自然画像に比べ,エッジにおいて画素値が急峻に変化するという特徴を持つため,低ピットレートで符号化を行うと高周波成分が失われ,画像が劣化する.そこで本稿では,画質の劣化を低減するため,セルアニメーション画像の特徴に基づき,画像を複数の領域に分割し,領域ごとに適応的な処理を施す手法を提案する.また,提案手法を実際のセルアニメーション画像に適用し,その有効性について検討を行う., 一般社団法人電子情報通信学会, 日本語
  • 共起を利用した学術論文の関連性の定量化とその可視化に関する一考察
    鎌倉 純一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 609, 127, 130, 2006年02月21日
    本文では,単語の共起情報を用いて学術論文の関連性を可視化する手法を提案する.論文において,著者の主張に関わる文に多く出現する単語は重要であると考えられる.また,重要な単語と多く共起する単語も,その論文を特徴づける重要な単語である.そこで提案手法では,単語の共起情報を用いて,各単語に対しその重要性を評価する特徴量を与え,これを用いて論文の特徴ベクトルを生成する.さらに,各論文の特徴ベクトルにより構成される行列に特異債分解を適用することで,論文間の関連性を反映した可視化結果を得る.本文の最後では,提案手法の有効性を示すために実験を行い,その可視化結果を評価する., 一般社団法人電子情報通信学会, 日本語
  • 動画像へのフラクタル符号化の適用法に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 105, 609, 131, 136, 2006年02月21日
    画像符号化手法の一つとして知られているフラクタル画像符号化は,画像の自己相似性を利用し,画像データを圧縮する.よって,得られる復号画像の品質は自己相似性と密接な関係があると考えられる.しかしながら,従来,この自己相似性と復号画質との関係について明らかにされてこなかった.そこで,以前我々は,これらの関係を明らかにするために,画像が持つ自己相似性の高さを表すための指標を示し,静止画像を対象として自己相似性と復号画質との関係について考察を行った.本文では,この自己相似性と復号画質との関係に基づき,フラクタル画像符号化の動画像への新たな適用法について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • ラインプロセスに着眼したIFSに基づくディジタル画像拡大法の高精度化に関する検討
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 1, 6, 2006年02月21日
    本文では, Iterated Function System (IFS)に基づく画像拡大法を提案する. IFSでは原画像とはサイズが異なる画像を再構成することが可能である.この特徴を用いて, IFSによる画像拡大法が従来より提案されている.しかしながら,従来手法により拡大された画像では, IPSによる処理の最小単位であるレンジブロックの境界において輝度値の不連続,およびエッジの不連続が発生する.これは,従来手法が重ならないレンジブロックを用いていること,および隣接するレンジブロックの境界においてエッジの連続性を考慮せず処理を行っていることによる.そこで提案手法では,レンジブロックの境界における輝度値の不連続を抑制するため,レンジブロックを重なりを許して選択可能とする.さらに,拡大処理の過程にラインプロセスを導入する.このとき,ラインプロセスを用いて得られるエッジは連続性を持つことから,拡大画像においてエッジの連続性が保たれる.以上に示す提案手法を用いれば,高精細な拡大画像を得ることが可能となる.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • ERアルゴリズムを用いた消失テクスチャ再構成法の高精度化に関する考察 : ERアルゴリズムの拘束条件に用いる部分空間の検討
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 7, 12, 2006年02月21日
    本文では,位相回復手法の一つであるER(Error Reduction)アルゴリズムを用いた静止画像中に存在する消失テクスチャの高精度な再構成法を提案する.提案手法ではERアルゴリズムで用いられる拘束条件を,復元対象領域およびそのフーリエ振幅がそれぞれ対象画像中の複数の局所領域およびそれらのフーリエ振幅から生成される二つの部分空間内に存在するように設定する.これにより,復元対象領域において未知であるフーリエ振幅および位相の推定が可能となり,消失領域の再構成が可能となる.さらに,提案手法では復元対象領域およびそのフーリエ振幅についてそれぞれ類似した局所領域とフーリエ振幅を選択し,これらを二つの部分空間の生成に用いている.これにより,得られる部分空間は復元対象領域に対して適応的に生成され,提案手法では高精度な消失テクスチャの再構成が可能となる.本文の最後では,提案手法の有効性を示すために実験を行い,その復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • 映像からの逆行者検知方法
    新井 啓之, 安野 貴之, 水上 緑, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 29, 34, 2006年02月21日
    指定された方向に逆らって歩行する逆行者を,斜め下向きに設置された一般的な監視カメラを利用して検知する手法を提案する。空港や駅など多くの人が通行している状況では,個人のトラッキングや単純なオプティカルフローの向きなどから逆行者を精度良く検知することは困難であり,雑踏の中で断片的に観測される逆行者を一連の動きとして検出する必要がある.この課題を解決するため,本手法では背景差分およびオプティカルフローの算出結果に基づき,ある瞬間tの左右方向の人物候補位置xとその移動方向を推定し,その結果をx-tマップに配置し,x-tマップ上でのハフ変換により一連の動きとして逆行を検知する.斜め下向きに設置されたカメラ映像を用いた実験を行い,本手法により逆行者を精度良く検知できることを確認した., 一般社団法人電子情報通信学会, 日本語
  • 領域に依存したフィルタ設計による高品質な画像圧縮に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 85, 88, 2006年02月21日
    現在,DVD,ディジタル放送などのビデオ符号化方式として,MPEG-2が広く用いられている.MPEG-2は,ブロック単位での動き補償とDCTを用い,効率的に圧縮を実現している.しかしながら,低ピットレートで符号化を行った場合,復号画像にブロックひずみやリンギングなどの劣化が発生するという問題がある.そこで,以前我々は,これらの劣化を軽減するために,符号化側でフレームごとに符号化誤差を最小にする2次元FIRフィルタを設計し,その係数を符号に付加する手法を提案した.本文では,フィルタの設計をフレームごとではなく,復号画像のエッジの方向に注目して領域分割を行い,その領域ごとにフィルタ設計を行う手法を提案する.本提案手法を用いることで,従来手法と比較して,より高品質な画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 領域別適応処理によるセルアニメーション画像の高品質化
    山口 巧, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 105, 108, 2006年02月21日
    動画配信のための映像符号化方式としてMPEG-4が広く用いられている.この符号化方式はブロック単位での動き補償および離散コサイン変換(DCT)を行い,DCT係数を量子化することで,効率的な圧縮を実現している.しかしながら,人工画像の一つである,セルアニメーション画像は自然画像に比べ,エッジにおいて画素値が急峻に変化するという特徴を持つため,低ビットレートで符号化を行うと高周波成分が失われ,画像が劣化する.そこで本稿では,画質の劣化を低減するため,セルアニメーション画像の特徴に基づき,画像を複数の領域に分割し,領域ごとに適応的な処理を施す手法を提案する.また,提案手法を実際のセルアニメーション画像に適用し,その有効性について検討を行う., 一般社団法人電子情報通信学会, 日本語
  • 共起を利用した学術論文の関連性の定量化とその可視化に関する一考察
    鎌倉 純一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 127, 130, 2006年02月21日
    本文では,単語の共起情報を用いて学術論文の関連性を可視化する手法を提案する.論文において,著者の主張に関わる文に多く出現する単語は重要であると考えられる.また,重要な単語と多く共起する単語も,その論文を特徴づける重要な単語である.そこで提案手法では,単語の共起情報を用いて,各単語に対しその重要性を評価する特徴量を与え,これを用いて論文の特徴ベクトルを生成する.さらに,各論文の特徴ベクトルにより構成される行列に特異値分解を適用することで,論文間の関連性を反映した可視化結果を得る.本文の最後では,提案手法の有効性を示すために実験を行い,その可視化結果を評価する., 一般社団法人電子情報通信学会, 日本語
  • 動画像へのフラクタル符号化の適用法に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 611, 131, 136, 2006年02月21日
    画像符号化手法の一つとして知られているフラクタル画像符号化は,画像の自己相似性を利用し,画像データを圧縮する.よって,得られる復号画像の品質は自己相似性と密接な関係があると考えられる.しかしながら,従来,この自己相似性と復号画質との関係について明らかにされてこなかった.そこで,以前我々は,これらの関係を明らかにするために,画像が持つ自己相似性の高さを表すための指標を示し,静止画像を対象として自己相似性と復号画質との関係について考察を行った.本文では,この自己相似性と復号画質との関係に基づき,フラクタル画像符号化の動画像への新たな適用法について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • 音楽信号における高精度な和音推定に関する一考察 : 低周波数域に存在する単音に着眼したアプローチ
    今野 聡司, 二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 13, 1, 4, 2006年02月20日
    映像情報メディア学会, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡の高精度化に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 13, 23, 26, 2006年02月20日
    映像情報メディア学会, 日本語
  • サッカー映像における動的輪郭モデルを用いた選手追跡に関する一考察
    渡辺 友樹, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 13, 27, 30, 2006年02月20日
    映像情報メディア学会, 日本語
  • アクティブネットを用いたサッカー映像解析に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 13, 31, 34, 2006年02月20日
    日本語
  • オーディオ信号を用いたオーディオビジュアルインデキシングの高精度化に関する一検討
    二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 30, 13, 77, 82, 2006年02月20日
    映像情報メディア学会, 日本語
  • 音楽信号における高精度な和音推定に関する一考察 : 低周波数域に存在する単音に着眼したアプローチ
    今野 聡司, 二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 608, 1, 4, 2006年02月20日
    本稿では,和音の構成に着眼することで,音楽信号中に存在する長和音,及び短和音を高精度に推定する手法を提案する.音楽信号の内容解析において和音は重要な指標であり,高精度に推定する必要がある.そのため,単音の推定に基づき和音を推定する研究が行われてきた.しかしながら,従来の研究では多数の単音が同時に存在する場合には十分な精度が得られていなかった.そこで,提案手法では,まず和音の基本音となるベース音のみの音高推定を行う.次にベース音に対して長和音,及び短和音の音程を示す周波数のパワーを求め,得られたパワーを比較することで和音の推定を行う.これにより,提案手法は高精度に推定された単音のみを用いるため,和音を構成する全ての単音を推定することなく和音の推定を可能とする., 一般社団法人電子情報通信学会, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡の高精度化に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 608, 23, 26, 2006年02月20日
    動画像中の物体追跡では,被覆の発生や陰影の変化により対象物体の輪郭線が得られず,追跡精度が低下する場合がある.前フレームの結果によりその影響を低減する手法も提案されているが,対象物体の撮像方向に変化が生じた場合には,精度の向上に限界がある.このような問題を解決するため,我々は以前,形状に基づく分裂型Snakesを用いた動物体追跡手法を提案した.この手法では追跡対象物体のおよその3次元形状が既知であるとし,あらかじめ複数の観察方向について用意された,概形の輪郭線をもとに動物体を抽出する.しかしながら,用意された輪郭線の中に適切な参照輪郭を示す形状が含まれていない場合,動物体の追跡精度に劣化が生じる可能性があった.そこで本文では,形状に基づく分裂型Snakesに対し定義されるエネルギーに,3次元形状の姿勢を表すパラメータを導入し,このエネルギーを最適化することで参照輪郭を適切に設定しながら高精度な動物体追跡を行う手法を提案する.本文の最後では,提案手法を実際の動画像へ適用し,その有効性について評価を行う., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像における動的輪郭モデルを用いた選手追跡に関する一考察
    渡辺 友樹, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 608, 27, 30, 2006年02月20日
    本稿では,動的輪郭モデルの一種であるレベルセット法を用いて,サッカーの試合映像に撮像された選手を追跡する手法を提案する.テレビ放送のサッカー中継で多用されているフィールドが広範囲に撮像されている映像では,隣接する2フレームにおいて選手の撮像されている位置がほぼ変化しないという特徴がある.提案手法では,このフレーム間における関係を利用するために,動画像を時刻順に画像が連結された3次元の画素の集合として捉え,その集合に対してレベルセット法を用いて選手を3次元の領域として抽出する.これにより,選手領域は全フレームを通して同一選手について1つの領域として抽出されるため,提案手法では選手の抽出を行うことにより,その追跡を同時に実現できる, 一般社団法人電子情報通信学会, 日本語
  • アクティブネットを用いたサッカー映像解析に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 608, 31, 34, 2006年02月20日
    画像処理や音声認識などにより,スポーツ映像を解析する手法が従来より提案されてきた.しかし,視聴者が希望する映像が多様であることを考慮してインデキシングや,自動要約生成を実現するためには,画像処理や音声認識に加えて,各スポーツの戦術などを考慮した意味内容解析が必要となる.そこで,本稿では,画像の領域抽出などに用いられるActive Netをサッカー映像に適用することで,意味内容を解析する一手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • オーディオ信号を用いたオーディオビジュアルインデキシングの高精度化に関する一検討
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 105, 608, 77, 82, 2006年02月20日
    映像信号の検索システムを構築する際,前処理として映像信号をショットやシーンに分割し,インデックスを付加する必要がある.そのため,従来よりショットやシーンの切り換わる時刻(ショットカット,シーンカット)を検出する手法が提案されている.しかしながら,従来手法は,映像信号より得られるオーディオ信号を音声や音楽のクラスに分類し,分類されたクラスが切り換わる時刻とショットカットが一致する時刻をシーンカットと判断するため,隣接するシーンのオーディオ信号が同一のクラスに分類された場合,シーンカットの未検出が発生する.この問題を解決するために,本稿では,主成分分析とファジィc-means法を用いたオーディオインデキシングを提案し,既存のショットカット検出法と組み合わせることで,隣接するショット間の類似度を考慮した新たなオーディオビジュアルインデキシングを提案する.隣接するショット間の類似度を定義することで,従来手法の問題を解決し,高精度なオーディオビジュアルインデキシングが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 音楽信号における高精度な和音推定に関する一考察 : 低周波数域に存在する単音に着眼したアプローチ
    今野 聡司, 二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 610, 1, 4, 2006年02月20日
    本稿では,和音の構成に着眼することで,音楽信号中に存在する長和音,及び短和音を高精度に推定する手法を提案する.音楽信号の内容解析において和音は重要な指標であり,高精度に推定する必要がある.そのため,単音の推定に基づき和音を推定する研究が行われてきた.しかしながら,従来の研究では多数の単音が同時に存在する場合には十分な精度が得られていなかった.そこで,提案手法では,まず和音の基本音となるベース音のみの音高推定を行う.次にベース音に対して長和音,及び短和音の音程を示す周波数のパワーを求め,得られたパワーを比較することで和音の推定を行う.これにより,提案手法は高精度に推定された単音のみを用いるため,和音を構成する全ての単音を推定することなく和音の推定を可能とする., 一般社団法人電子情報通信学会, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡の高精度化に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 610, 23, 26, 2006年02月20日
    動画像中の物体追跡では,被覆の発生や陰影の変化により対象物体の輪郭線が得られず,追跡精度が低下する場合がある.前フレームの結果によりその影響を低減する手法も提案されているが,対象物体の撮像方向に変化が生じた場合には,精度の向上に限界がある.このような問題を解決するため,我々は以前,形状に基づく分裂型Snakesを用いた動物体追跡手法を提案した.この手法では追跡対象物体のおよその3次元形状が既知であるとし,あらかじめ複数の観察方向について用意された,概形の輪郭線をもとに動物体を抽出する.しかしながら,用意された輪郭線の中に適切な参照輪郭を示す形状が含まれていない場合,動物体の追跡精度に劣化が生じる可能性があった.そこで本文では,形状に基づく分裂型Snakesに対し定義されるエネルギーに,3次元形状の姿勢を表すパラメータを導入し,このエネルギーを最適化することで参照輪郭を適切に設定しながら高精度な動物体追跡を行う手法を提案する.本文の最後では,提案手法を実際の動画像へ適用し,その有効性について評価を行う., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像における動的輪郭モデルを用いた選手追跡に関する一考察
    渡辺 友樹, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 610, 27, 30, 2006年02月20日
    本稿では,動的輪郭モデルの一種であるレベルセット法を用いて,サッカーの試合映像に撮像された選手を追跡する手法を提案する.テレビ放送のサッカー中継で多用されているフィールドが広範囲に撮像されている映像では,隣接する2フレームにおいて選手の撮像されている位置がほぼ変化しないという特徴がある.提案手法では,このフレーム間における関係を利用するために,動画像を時刻順に画像が連結された3次元の画素の集合として捉え,その集合に対してレベルセット法を用いて選手を3次元の領域として抽出する.これにより,選手領域は全フレームを通して同一選手について1つの領域として抽出されるため,提案手法では選手の抽出を行うことにより,その追跡を同時に実現できる, 一般社団法人電子情報通信学会, 日本語
  • アクティブネットを用いたサッカー映像解析に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 610, 31, 34, 2006年02月20日
    画像処理や音声認識などにより,スポーツ映像を解析する手法が従来より提案されてきた.しかし,視聴者が希望する映像が多様であることを考慮してインデキシングや,自動要約生成を実現するためには,画像処理や音声認識に加えて,各スポーツの戦術などを考慮した意味内容解析が必要となる.そこで,本稿では,画像の領域抽出などに用いられるActive Netをサッカー映像に適用することで,意味内容を解析する一手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • オーディオ信号を用いたオーディオビジュアルインデキシングの高精度化に関する一検討
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 610, 77, 82, 2006年02月20日
    映像信号の検索システムを構築する際,前処理として映像信号をショットやシーンに分割し,インデックスを付加する必要がある.そのため,従来よりショットやシーンの切り換わる時刻(ショットカット,シーンカット)を検出する手法が提案されている.しかしながら,従来手法は,映像信号より得られるオーディオ信号を音声や音楽のクラスに分類し,分類されたクラスが切り換わる時刻とショットカットが一致する時刻をシーンカットと判断するため,隣接するシーンのオーディオ信号が同一のクラスに分類された場合,シーンカットの未検出が発生する.この問題を解決するために,本稿では,主成分分析とファジィc-means法を用いたオーディオインデキシングを提案し,既存のショットカット検出法と組み合わせることで,隣接するショット間の類似度を考慮した新たなオーディオビジュアルインデキシングを提案する.隣接するショット間の類似度を定義することで,従来手法の問題を解決し,高精度なオーディオビジュアルインデキシングが可能となる., 一般社団法人電子情報通信学会, 日本語
  • クラスタリング手法 Dynamic Coalescence Model に基づく新しい離散クラスタリング手法
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, 105, 536, 159, 164, 2006年01月13日
    本論文では場の概念に基づく新しい離散クラスタリング手法を提案する.特徴空間内の点を質点と仮定し, その位置を格子点に量子化した後, 点をその加速度に応じて高々隣接する格子点に動かすことを繰り返し, 1個の格子点に集めた点の集合をクラスタとする.点の加速度が, 全ての点の質量を1と仮定する場合にその点が他の点から受ける引力を表す引力関数と各格子点にある点の質量を表す点分布関数との畳み込み和で表され, その点から見た点分布の概略を表しかつその点を中心とし半径が一定の超球内にある他の点から受ける引力で決まることを明らかにする.2次元2クラス混合正規, 半円弧分布で表されるパターン分布において, 提案手法で所属クラスが正しく推測されるパターンの割合は連続的なDynamic Coalescence Methodの135.0%と高く, 計算時間は0.0747%と極めて短い., 一般社団法人電子情報通信学会, 日本語
  • クラスタリング手法 Dynamic Coalescence Model に基づく新しい離散クラスタリング手法
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 105, 534, 159, 164, 2006年01月13日
    本論文では場の概念に基づく新しい離散クラスタリング手法を提案する.特徴空間内の点を質点と仮定し, その位置を格子点に量子化した後, 点をその加速度に応じて高々隣接する格子点に動かすことを繰り返し, 1個の格子点に集めた点の集合をクラスタとする.点の加速度が, 全ての点の質量を1と仮定する場合にその点が他の点から受ける引力を表す引力関数と各格子点にある点の質量を表す点分布関数との畳み込み和で表され, その点から見た点分布の概略を表しかつその点を中心とし半径が一定の超球内にある他の点から受ける引力で決まることを明らかにする.2次元2クラス混合正規, 半円弧分布で表されるパターン分布において, 提案手法で所属クラスが正しく推測されるパターンの割合は連続的なDynamic Coalescence Methodの135.0%と高く, 計算時間は0.0747%と極めて短い., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムによる不均一伝送線路型整合回路の設計
    真田 博文, 伊藤 洋明, 竹沢 恵, 渡辺 一央, 長谷山 美紀, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 105, 503, 7, 12, 2006年01月05日
    本稿では, 遺伝的アルゴリズム(Genetic Algorithm : GA)を利用した不均一伝送線路型整合回路の設計について検討した結果を報告する. 本稿で提案する手法では, 不均一伝送線路の特性抵抗分布の決定を最適化問題としてとらえ, GAにより所望の周波数特性を実現する構造を決定する. 実際にいくつかの整合回路の設計を行い, 提案手法が整合回路の一設計手法となり得ることを示すと共に, 回路形状やサイズなどの制限を考慮した設計が可能であることを述べる., 一般社団法人電子情報通信学会, 日本語
  • A MODEL-BASED APPROACH FOR SOCCER TEAM ADVANTAGE MEASUREMENT
    Kon Hirofumi, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 501, 317, 322, 2006年01月03日
    This paper proposes a method of measuring team advantage to facilitate understanding of soccer game contents in TV images. In the proposed method, the team advantage is represented by possibility of getting a goal. The possibility is defined by using a novel player-action model, which is realized by a Markov-chain model. The Markov-chain model is suitable to realize the player-action model, because it denotes the transition probability between two states; that is, in the proposed method, player action states and their result ones, such as "Shoot", "Goal", etc. By using the player-action model, the proposed method can analyze the games more effectively than the other traditional methods, which utilize only the player locations. Consequently, through the proposed method, the users can not only understand the soccer game situations, such as the scenes that the players scrambled to get a ball, the favorite team of the users is getting a goal, etc, but also watch the games from the technical and tactical perspectives. Some experiments on real soccer videos have demonstrated the effectiveness of the proposed method., 一般社団法人電子情報通信学会, 英語
  • A SIMILAR IMAGE CLUSTERING METHOD INCLUDING AUTOMATIC SELECTION OF NUMBER OF CLUSTERS
    Ohara Takatoshi, Ogawa Takahiro, Haseyama Miki, KITAJIMA Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 501, 209, 212, 2006年01月03日
    This paper proposes an image clustering method which includes an automatic cluster-number setting scheme. By using the proposed method, the user can effectively categorize similar images existing in an image database without presetting the total number of categories. Actually, the proposed method is based on a k-means algorithm which utilizes a color histogram of each image as a feature vector, and the number of the cluster is determined, according to the variation of the average of the clustering error in several number of the clusters. Consequently, the proposed method can automatically select the suitable number of the clusters for the image database, and then it provides the accurate image clustering result. Some experimental results show the proposed method achieves accurate clusterings., 一般社団法人電子情報通信学会, 英語
  • AN IMAGE ENLARGEMENT METHOD USING ITERATED FUNCTION SYSTEM
    Kakukou Norihiro, Ogawa Takahiro, Haseyama Miki, KITAJIMA Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 500, 283, 286, 2006年01月02日
    This paper proposes an effective image enlargement method based on an Iterated Function System (IFS), which is well-known as an image coding method. The IFS can reconstruct an image of a different size from the coding target image's. Based on this property, this paper expands the IFS for coding to a method for the image enlargement. However, if the IFS is simply expanded for the image enlargement use, it cannot achieve accurate enlargement. For example, the block-wised procedures of the IFS make a problem that the enlarged images suffer from block noise. Therefore, the proposed method is realized by not only the expansion but also some modifications. Some simulation results are shown to verify that the performance of the proposed method is higher than that of the conventional methods., 一般社団法人電子情報通信学会, 英語
  • EFFECTIVE PEDESTRIAN DETECTION IN LOW-CONTRAST IMAGES
    Kaga Yosuke, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 500, 287, 290, 2006年01月02日
    This paper proposes an accurate pedestrian detection method in low-contrast images by using Support Vector Machine (SVM). The proposed pedestrian detection is realized by the following two systems : (1) Moving object extraction system In the low contrast case, traditional methods cannot extract the moving objects successfully. Therefore, in order to accurately extract the objects, the proposed method adopts hierarchical procedures depending on the intensity levels of the low-contrast images. (2) Pedestrian decision system From the objects extracted by (1), two features, which are the ratio between the width and the height and the moving speed, are computed. Pedestrian decision is executed by inputting these features to the SVM. By using these two systems, the features can be accurately extracted, and the SVM using these features can successfully judge whether the moving object is a pedestrian or not. Consequently, the proposed method can accurately detect the pedestrian in low-contrast images. Some experimental results are shown to verify the effectiveness of the proposed method., 一般社団法人電子情報通信学会, 英語
  • A VIDEO CODING TECHNIQUE USING FRACTAL CODING
    Takezawa Megumi, Sanada Hirofumi, Watanabe Kazuhisa, WATANABE Kazuhisa, 電子情報通信学会技術研究報告. IE, 画像工学, 105, 500, 51, 54, 2006年01月02日
    This paper proposes a new approach to video coding that utilizes the fractal image coding. The fractal image coding based on an iterated function system is one of the coding techniques for digital images. It utilizes the self-similarity of the images and thus realizes the high image-compression performance. However, we cannot adopt the fractal image coding as the standard coding technique because its decoded images are sometimes low quality. Therefore, in this paper, to promote the use of the fractal image coding, we clarify the difference between the suitable images, whose decoded images are high quality, and the unsuitable images, whose decoded images are low quality. Then, based on the results, we apply the fractal image coding adaptively to each image. In this paper, we extend this approach to encoding the video images and show some simulations., 一般社団法人電子情報通信学会, 英語
  • 動画像信号と音響信号を用いた映像の類似シーン検出に関する検討
    道山大悟, 二反田直己, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2006, 2006年
  • 低コントラスト画像における動物体抽出の高精度化に関する一考察
    加賀陽介, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2006, 2006年
  • SVMによる画像分類を用いた製造フィルムの欠陥種類の識別に関する検討
    瀧澤誠, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2006, 2006年
  • 音楽信号におけるフレーズに着眼した重要旋律の推定に関する一考察
    今野聡司, 二反田直己, 長谷山美紀, 電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2006, 2006年
  • 映像検索技術-その必要性の増大と技術革新について
    長谷山美紀, テクノカレント, 419, 2006年
  • Bandwidth-efficient information-providing system for mobile phone users
    Shin'ichi Shiraishi, Daisuke Sakuma, Miki Haseyama, Hideo Kitajima, Digest of Technical Papers - IEEE International Conference on Consumer Electronics, 2006, 389, 390, 2006年
    This paper proposes an information-providing system for mobile phone users. The proposed system only requires reduced bandwidth and then brings a low latency service. Therefore, the system is suitable for urgent usage such as an information service for emergency rescue. © 2006 IEEE., 英語
  • An improved GRAS algorithm using archimedes's spiral
    Yanjun Zhao, Miki Haseyama, Hideo Kitajima, ISSCAA 2006: 1ST INTERNATIONAL SYMPOSIUM ON SYSTEMS AND CONTROL IN AEROSPACE AND ASTRONAUTICS, VOLS 1AND 2, 2006, 461, +, 2006年
    In this paper an improvement is proposed to solve a problem in the object recognition using GRAS: when an object is rotated, the change may not be acceptable by GRAS in most cases. The proposed algorithm searches the shape of a given object to define some nodes by Archimedes's spiral, and transforms the nodes into a directed graph. Then, it defines some interrelated graph characteristics to compare the given object with others. The performance of the proposed algorithm is presented via experimental results which compare the recognition accuracy of GRAS and proposed algorithm., IEEE, 英語
  • An accurate ifs-based image enlargement method using line process
    Norihiro Kakukou, Takahiro Ogawa, Miki Haseyama, Hideo Kitajima, 2006 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, ICIP 2006, PROCEEDINGS, 2701, +, 2006年
    This paper proposes an effective image enlargement method based on an Iterated Function System(IFS), which is traditionally used for image coding. The IFS can reconstruct an image of a different size from the coding target image's. Based on this property, some methods enlarging images have been proposed by using the IFS. However, the images enlarged by the traditional methods suffer from block noise and edge discontinuity in the boundary between neighboring range blocks, which are units of the process in the IFS. The reasons for the problems of the traditional methods are that they use non-overlapping range blocks and do not consider edge continuity in the boundary between the neighboring range blocks. Therefore, the proposed method allows selection of overlapping range blocks in order to avoid the block noise. Further, the proposed method introduces a line process, which is used for edge detection, into the enlargement procedure. The edges obtained by using the line process can retain the edge continuity. Therefore, the images enlarged by the proposed method retain the edge continuity. Consequently, an accurate image enlargement can be achieved., IEEE, 英語
  • A novel image recognition method by vector voting
    Masao Hiramoto, Miki Haseyama, WMSCI 2006: 10TH WORLD MULTI-CONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL V, PROCEEDINGS, 5, 234, +, 2006年
    This paper introduces a new method for recognizing images and finding their sizes and angles. Using this method, an image is constructed from 2 types of vectors-vectors indicating positions and vectors denoting intensity gradients for those positions, and image recognition data is created from the vectors. When investigating the difference between a reference image and a sample one, we vote vectors and similarities are evaluated by calculating voting densities in the image space. Furthermore when two images are identified, we can find the size and angle of the sample image in comparison with the reference one by summating voted vectors at the origin. The proposed method is invariant to image rotation and size. Using this method, we carried out experimentation recognizing images and finding their sizes and angles, and the results show that the method is effective in retrieving images., INT INST INFORMATICS & SYSTEMICS, 英語
  • A steady-state analysis of a CORDIC-Based adaptive ARMA lattice filter
    Shin'ichi Shiraishi, Miki Haseyama, Hideo Kitajima, TENCON 2005 - 2005 IEEE REGION 10 CONFERENCE, VOLS 1-5, 2007, 2266, +, 2006年
    This paper analyzes steady-state properties of a CORDIC-based adaptive ARMA lattice filter. In our earlier work, convergence properties of the filter in the non-steady state have been clarified; however, its behavior in the steady-state is not discussed. Therefore, we develop a distinct analysis technique based on a Markov chain in order to investigate steady-state properties of the filter. By using the proposed technique, the relation between step size and coefficient estimation error is revealed. We can use the results of the analysis to obtain an efficient design of the filter., IEEE, 英語
  • テーブル参照による動き補償のための動きテーブル高精度化に関する考察
    浅水 仁, 長谷山 美紀, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 88, 9, 1982, 1985, 2005年09月01日
    ブロックマッチング法により求めた各フレームの予測誤差を重みとしてGAの評価関数に導入し, 符号化対象画像に必要な動きを探索する手法を提案する. 提案手法を用いることにより, フレームごとの予測画像の画質は, ばらつきが小さくなることを確認した., 一般社団法人電子情報通信学会, 日本語
  • 動的輪郭モデルを用いた位相回復手法に関する一考察 (サマーセミナー(若葉研究者の発表会))
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 46, 1, 4, 2005年08月
    映像情報メディア学会, 日本語
  • 静止画像中に存在する消去テクスチャの再構成に関する検討--ERアルゴリズムにおける拘束条件の考察 (サマーセミナー(若葉研究者の発表会))
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 46, 5, 8, 2005年08月
    映像情報メディア学会, 日本語
  • オーディオインデキシングにおける特徴量の選択に関する一考察 (サマーセミナー(若葉研究者の発表会))
    二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 46, 9, 12, 2005年08月
    映像情報メディア学会, 日本語
  • 音楽信号の低周波数域における楽曲の構成に着眼した時間周波数解析に関数する検討 (サマーセミナー(若葉研究者の発表会))
    今野 聡司, 二反田 直己, 長谷山 美紀, 映像情報メディア学会技術報告, 29, 46, 13, 16, 2005年08月
    映像情報メディア学会, 日本語
  • Convergence properties of a CORDIC-based adaptive ARMA lattice filter
    S Shiraishi, M Haseyama, H Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E88A, 8, 2154, 2164, 2005年08月
    This paper presents a theoretical convergence analysis of a CORDIC-based adaptive ARMA lattice filter. In previous literatures, several investigation methods for adaptive lattice filters have been proposed; however, they are available only for AR-type filters. Therefore, we have developed a distinct technique that can reveal the convergence properties of the CORDIC ARMA lattice filter. The derived technique provides a quantitative convergence analysis, which facilitates an efficient hardware design for the filter. Moreover, our analysis technique can be applied to popular multiplier-based filters by slight modifications. Hence, the presented convergence analysis is significant as a leading attempt to investigate ARMA lattice filters., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • フィルタリング理論に基づく新しい離散的クラスタリング手法
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. WBS, ワイドバンドシステム : IEICE technical report, 105, 177, 39, 44, 2005年07月08日
    本論文ではフィルタリング理論に基づく新しい離散的クラスタリング手法を提案する.手順の概略は次の通りである.まず特徴空間を格子で離散化し, パターンを表す点を格子点に対応付ける.次に静力学の概念に基づいて各点を他の点から受ける微小な引力で格子上をたどり近隣の格子点に移す.その後, 点を球と仮定し接触する球を凝縮する.この点の移動凝縮を1ステップとし, これを点の数が希望する数に減るまで繰り返し, 得られる点をそれが含む点が表すパターンの所属クラスとする.点分布は点の微小移動によりその分布種を同定できる分布に変換されるが, 分布の凝縮に要するステップ数が多い.そのため, 点を他の点とすれ違わない範囲で長く動かすためにパラメータの値を点分布ごとに調整するが, 分布変換(点の移動凝縮)の基準は一定であることを理論的に明らかにし, 提案手法の有用性を示す.特に点移動について, まず点の移動変位がその点が他の点から受ける引力を表す引力関数と点分布を表す関数との畳み込み和から求められることを示す.この新しい視点から引力関数がフィルタであり, その特性を表す窓がパラメータの値に無関係であることを明らかにする.さらにパラメータ値の設定法も考察する., 一般社団法人電子情報通信学会, 日本語
  • フィルタリング理論に基づく新しい離散的クラスタリング手法
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. SIP, 信号処理, 105, 175, 39, 44, 2005年07月08日
    本論文ではフィルタリング理論に基づく新しい離散的クラスタリング手法を提案する.手順の概略は次の通りである.まず特徴空間を格子で離散化し, パターンを表す点を格子点に対応付ける.次に静力学の概念に基づいて各点を他の点から受ける微小な引力で格子上をたどり近隣の格子点に移す.その後, 点を球と仮定し接触する球を凝縮する.この点の移動凝縮を1ステップとし, これを点の数が希望する数に減るまで繰り返し, 得られる点をそれが含む点が表すパターンの所属クラスとする.点分布は点の微小移動によりその分布種を同定できる分布に変換されるが, 分布の凝縮に要するステップ数が多い.そのため, 点を他の点とすれ違わない範囲で長く動かすためにパラメータの値を点分布ごとに調整するが, 分布変換(点の移動凝縮)の基準は一定であることを理論的に明らかにし, 提案手法の有用性を示す.特に点移動について, まず点の移動変位がその点が他の点から受ける引力を表す引力関数と点分布を表す関数との畳み込み和から求められることを示す.この新しい視点から引力関数がフィルタであり, その特性を表す窓がパラメータの値に無関係であることを明らかにする.さらにパラメータ値の設定法も考察する., 一般社団法人電子情報通信学会, 日本語
  • ブロックの動きと画像内容を考慮した付加ビットを必要としない適応内挿フィルタ選択法
    徳永 佳晃, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理, 88, 7, 1313, 1317, 2005年07月01日
    本論文では動画像符号化における適応内挿フィルタ手法において, 動きと画像内容に応じてフィルタを適応的に選択する手法を提案する.提案手法はフィルタ選択情報を必要とせずに動き補償性能を高めることができ, 符号化効率向上を実現する., 一般社団法人電子情報通信学会, 日本語
  • Sample size dependence of estimation error of information carried by neuronal spike train
    Jun Murakami, Tomohide Kidachi, Miki Haseyama, Tateo Shimozawa, Systems and Computers in Japan, 36, 7, 84, 95, 2005年06月30日
    The operating performance of a neural system should be represented by the amount of information carried by neurons. The neuron behaves as a pulse encoder, which converts a stimulus waveform into a discrete pulse (spike) train. In practice, the rate of information transmission is estimated on the basis of a finite number of spikes obtained in a finite observation period. Consequently, the result includes an error. This paper considers the case in which the rate of information transmission is derived from the stimulus-response coherence, and analyzes the relation between the estimation error and the sample size (total number of spikes). It is found that the estimation error of information carried by a single spike is inversely proportional to the total number of spikes used for the estimation. It is pointed out that the asymptotic value of inverse proportion should be used for the comparison of information obtained from different neurons. The validity of the relation between the number of samples and the information per spike is verified by using data obtained from the cricket cercal sensory cells. © 2005 Wiley Periodicals, Inc., 英語
  • 高次ニューラルネットワークを用いたパターン認識
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 104, 741, 7, 12, 2005年03月10日
    本論文では2値点分布で表されるパターンの認識系を提案する.この系の特徴抽出器は, 点分布に対する2点の相対的な距離や位置を用いて点分布の構造を表現する, 新しい特徴ベクトルを生成する.この特徴ベクトルは点分布の移動, 回転および伸縮にロバストである.特徴抽出器は2次であり計算量は少ない.その特徴抽出器はさらに, 学習パターンから特徴ベクトルを生成する際, 点分布の変形や歪を理論的に補正する.そのため, 識別器は学習パターンの特徴ベクトル1個でその未知なる変形・歪パターンも学習する.したがって, 学習時間は短く認識率は高い.識別器は3次2層ニューラルネットワークである.この系の汎用性を手書き文字認識や分布同定により実験的に示す., 一般社団法人電子情報通信学会, 日本語
  • 高次ニューラルネットワークを用いたパターン認識
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. TL, 思考と言語, 104, 739, 7, 12, 2005年03月10日
    本論文では2値点分布で表されるパターンの認識系を提案する.この系の特徴抽出器は, 点分布に対する2点の相対的な距離や位置を用いて点分布の構造を表現する, 新しい特徴ベクトルを生成する.この特徴ベクトルは点分布の移動, 回転および伸縮にロバストである.特徴抽出器は2次であり計算量は少ない.その特徴抽出器はさらに, 学習パターンから特徴ベクトルを生成する際, 点分布の変形や歪を理論的に補正する.そのため, 識別器は学習パターンの特徴ベクトル1個でその未知なる変形・歪パターンも学習する.したがって, 学習時間は短く認識率は高い.識別器は3次2層ニューラルネットワークである.この系の汎用性を手書き文字認識や分布同定により実験的に示す., 一般社団法人電子情報通信学会, 日本語
  • クラスタリング手法DCMの解析
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. KBSE, 知能ソフトウェア工学, 104, 724, 31, 36, 2005年03月07日
    本論文ではパターンを対応づけるクラスを推測するクラスタリング手法Dynamic Coalescence Model (DCM)をフィルタリング理論を用いて解析する.DCMではパターンを表す特徴空間内の点を2点間の引力で動かし, 集まった点の集合をそれらの点の所属クラスとする.本論文では引力関数がフィルタであり, 点の移動変位はその点を基準としたこのフィルタの, 点分布の入力に対する出力から求められることを示す.この新しい視点から, 提案された引力の中でGaussian引力がクラスタリングに最も有用であることを明らかにする., 一般社団法人電子情報通信学会, 日本語
  • A-1-3 遺伝的アルゴリズムを用いた伝送線路フィルタ設計(A-1. 回路とシステム, 基礎・境界)
    真田 博文, 竹沢 恵, 渡辺 一央, 長谷山 美紀, 電子情報通信学会総合大会講演論文集, 2005, 3, 3, 2005年03月07日
    一般社団法人電子情報通信学会, 日本語
  • A genetic algorithm for routing with an upper bound constraint
    J Inagaki, M Haseyama, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E88D, 3, 679, 681, 2005年03月
    This paper presents a method of searching for the shortest route via the most designated points with the length not exceeding the preset upper bound. The proposed algorithm can obtain the quasi-optimum route efficiently and its effectiveness is verified by applying the algorithm to the actual map data., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • リング周波数フィルタを用いた眉間検出における前髪の影響に関する検討
    長谷山 美紀, 金子 千晶, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 88, 3, 661, 664, 2005年03月01日
    リング周波数フィルタは, 高速かつ高精度に眉間の位置を検出できるが, 前髪を眉の近くまでおろしている人の顔に対しては, 適用ができない.本論文では, このような場合にも, 適用を可能とするためにフィルタの適用領域を限定する前処理を提案する., 一般社団法人電子情報通信学会, 日本語
  • ブロックの動きと画像内容を考慮した適応内挿フィルタ選択法 : 適応的フィルタ窓設計に関する考察
    徳永 佳晃, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 9, 51, 54, 2005年02月04日
    映像情報メディア学会, 日本語
  • 2次元FIRフィルタを用いた高品質な画像圧縮の実現に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 9, 55, 58, 2005年02月04日
    映像情報メディア学会, 日本語
  • フラクタル画像符号化による再構成画像の品質推定に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀, 映像情報メディア学会技術報告, 29, 9, 59, 64, 2005年02月04日
    静止画像の符号化手法の一つとして知られているフラクタル画像符号化は, 画像の自己相似性を利用し, 画像データを圧縮している.よって, フラクタル画像符号化により得られる復号画像の品質は, 画像の持つ自己相似性の高さと密接な関係があると考えられる.しかしながら, 従来, この自己相似性の高さに対する定量的な指標は明確に定めらていなく, 自己相似性の高さと復号画質との関係も明らかにされていない.そこで本文では, 自己相似性の高さを表すための指標を示し, その指標に基づき自己相似性と復号画質の関係について考察を行う., 映像情報メディア学会, 日本語
  • ブロックの動きと画像内容を考慮した適応内挿フィルタ選択法 : 適応的フィルタ窓設計に関する考察
    徳永 佳晃, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 647, 51, 54, 2005年02月04日
    近年動き補償予測動画像符号化において, 予測精度の高い動き補償を可能とする適応内挿フィルタ手法が提案されている.この手法では小数精度参照画像を作成するために, 水平あるいは垂直方向の固定フィルタ窓を用いた画素補間が行われる.しかしながら, フィルタ窓の設計には自由度があり, フィルタ窓の設計法によっては動き補償予測精度改善の余地が残されていると考えられる.そこで我々は被写体の動きに着目し, 被写体の動きの方向に応じてフィルタ窓を適応的に変化させる手法を提案する.標準動画像を用いた符号化シミュレーションにより, 提案手法は従来手法と比較して同PSNRにおいてさらに総符号量を削減可能であることを示す., 一般社団法人電子情報通信学会, 日本語
  • 2次元FIRフィルタを用いた高品質な画像圧縮の実現に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 647, 55, 58, 2005年02月04日
    DVD, インターネットでの動画像配信などのビデオ符号化方式として, MPEG-1やMPEG-2が広く用いられている.これらの符号化方式では, ブロック単位での動き補償とDCTを用い, 効率的に圧縮を実現している.しかしながら, 低ビットレートで符号化を行った場合, 復号画像にブロックひずみやリンギングなどの劣化が発生するという問題がある.そこで本文では, これらの劣化を軽減するために, 符号化側で符号化誤差を最小にする2次元FIRフィルタを設計し, その係数を符号に付加する手法を提案する.提案手法では, 復号側でフィルタ係数から構成されるフィルタを復号画像に適用する.本提案手法を用いることで, より高品質な画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • フラクタル画像符号化による再構成画像の品質推定に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀, 電子情報通信学会技術研究報告. ITS, 104, 647, 59, 64, 2005年02月04日
    静止画像の符号化手法の一つとして知られているフラクタル画像符号化は, 画像の自己相似性を利用し, 画像データを圧縮している.よって, フラクタル画像符号化により得られる復号画像の品質は, 画像の持つ自己相似性の高さと密接な関係があると考えられる.しかしながら, 従来, この自己相似性の高さに対する定量的な指標は明確に定めらていなく, 自己相似性の高さと復号画質との関係も明らかにされていない.そこで本文では, 自己相似性の高さを表すための指標を示し, その指標に基づき自己相似性と復号画質の関係について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • ブロックの動きと画像内容を考慮した適応内挿フィルタ選択法 : 適応的フィルタ窓設計に関する考察
    徳永 佳晃, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 649, 51, 54, 2005年02月04日
    近年動き補償予測動画像符号化において, 予測精度の高い動き補償を可能とする適応内挿フィルタ手法が提案されている.この手法では小数精度参照画像を作成するために, 水平あるいは垂直方向の固定フィルタ窓を用いた画素補間が行われる.しかしながら, フィルタ窓の設計には自由度があり, フィルタ窓の設計法によっては動き補償予測精度改善の余地が残されていると考えられる.そこで我々は被写体の動きに着目し, 被写体の動きの方向に応じてフィルタ窓を適応的に変化させる手法を提案する.標準動画像を用いた符号化シミュレーションにより, 提案手法は従来手法と比較して同PSNRにおいてさらに総符号量を削減可能であることを示す., 一般社団法人電子情報通信学会, 日本語
  • 2次元FIRフィルタを用いた高品質な画像圧縮の実現に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 649, 55, 58, 2005年02月04日
    DVD, インターネットでの動画像配信などのビデオ符号化方式として, MPEG-1やMPEG-2が広く用いられている.これらの符号化方式では, ブロック単位での動き補償とDCTを用い, 効率的に圧縮を実現している.しかしながら, 低ビットレートで符号化を行った場合, 復号画像にブロックひずみやリンギングなどの劣化が発生するという問題がある.そこで本文では, これらの劣化を軽減するために, 符号化側で符号化誤差を最小にする2次元FIRフィルタを設計し, その係数を符号に付加する手法を提案する.提案手法では, 復号側でフィルタ係数から構成されるフィルタを復号画像に適用する.本提案手法を用いることで, より高品質な画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • フラクタル画像符号化による再構成画像の品質推定に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 649, 59, 64, 2005年02月04日
    静止画像の符号化手法の一つとして知られているフラクタル画像符号化は, 画像の自己相似性を利用し, 画像データを圧縮している.よって, フラクタル画像符号化により得られる復号画像の品質は, 画像の持つ自己相似性の高さと密接な関係があると考えられる.しかしながら, 従来, この自己相似性の高さに対する定量的な指標は明確に定めらていなく, 自己相似性の高さと復号画質との関係も明らかにされていない.そこで本文では, 自己相似性の高さを表すための指標を示し, その指標に基づき自己相似性と復号画質の関係について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • ファジィ c-means 法を用いたオーディオ信号の分割・分類法 : 音声及び音楽クラス間の距離の定義に関する考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 51, 56, 2005年02月03日
    日本語
  • 姿勢の変化を考慮した高精度な歩行者追跡に関する考察
    松田 耕平, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 29, 34, 2005年02月03日
    映像情報メディア学会, 日本語
  • サッカー映像からのチーム優勢度の判定に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 35, 40, 2005年02月03日
    映像情報メディア学会, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 41, 44, 2005年02月03日
    映像情報メディア学会, 日本語
  • ファジィ c-means 法を用いたオーディオ信号の分割・分類法 : 音声及び音楽クラス間の距離の定義に関する考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 51, 56, 2005年02月03日
    映像情報メディア学会, 日本語
  • 静止画像中に存在する消失テクスチャの再構成に関する検討ERアルゴリズムの応用
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 75, 80, 2005年02月03日
    映像情報メディア学会, 日本語
  • ニューラルネットワークを用いたサッカー映像のインデキシングに関する考察
    堤 公希, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 93, 98, 2005年02月03日
    映像情報メディア学会, 日本語
  • ファジィクラスタリングを用いたサッカー映像におけるオーディオインデキシングに関する考察
    渡辺 隆志, 二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 99, 104, 2005年02月03日
    映像情報メディア学会, 日本語
  • 色彩と形状に着目した虹彩の自動抽出に関する検討
    金子 千晶, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 105, 110, 2005年02月03日
    顔画像に対して分離度フィルタを適用することにより, 虹彩や鼻孔などの円形状を呈する顔部品を抽出する手法が既に提案されている.しかしながら, このフィルタを用いて顔領域全体から虹彩のみを抽出しようとした場合, 鼻孔を誤って抽出する可能性がある.そこで本文では, 眉間を検出するために提案されているリング周波数フィルタを応用して分離度フィルタの適用範囲を限定することにより, 精度良く虹彩を抽出する手法を提案する.提案手法ではまず, 目が持つ色彩の特徴に基づき両目が存在する領域を推定する.この領域にリング周波数フィルタ適用することにより精度良く眉間の位置を求め, これを用いて左右の虹彩が存在する領域を推定する.こうして得られる領域にのみ分離度フィルタを適用することにより, 高精度に虹彩を抽出することが可能となる., 映像情報メディア学会, 日本語
  • 救急救命アシスタンスのための携帯電話を用いた情報提供システムの構築
    佐久間 大輔, 白石 真一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 29, 8, 137, 142, 2005年02月03日
    映像情報メディア学会, 日本語
  • 姿勢の変化を考慮した高精度な歩行者追跡に関する考察
    松田 耕平, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 29, 34, 2005年02月03日
    本文では, 姿勢の変化にロバストな動画像中の歩行者の追跡手法を提案する.提案手法では, テンプレートマッチングによる追跡処理を行う際に, 歩行に伴う姿勢の変化を考慮するだけでなく, 歩行者領域に発生しているオクルージョンの有無を判定し, その精度を向上させる.具体的には, 姿勢の変化に応じたテンプレートを準備しておき, 過去のフレームにおける追跡結果から対象フレームにおける歩行者の姿勢を予測し, その姿勢に対応したテンプレートを用いてマッチングを行う.ここで, 追跡結果とテンプレートの差分を評価することで歩行者に対するオクルージョンの有無を判定し, オクルージョンの生じていない過去のフレームを用いて姿勢を予測することで, さらなる精度向上を目指す.以上のように導出された提案手法を用いることで, 歩行者の姿勢の変化を考慮した高精度な追跡を実現できる.本文の最後では, 実画像を用いた実験を行い, 提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像からのチーム優勢度の判定に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 35, 40, 2005年02月03日
    サッカーは多様な試合展開が存在し, 視聴者によっては試合展開を理解するのが困難な場合がある.したがって, 視聴者に試合展開を表現したデータを提示する技術が必要である.試合展開を表現する手段として, チームが得点できる可能性を表す, チームの優勢度があり, これをサッカー映像と共に視聴者に提示することができれば, サッカー映像が理解しやすいものとなる.そこで, 本稿では, 選手の行動をモデル化し, 作成されたモデルにより, チームの優勢度を判定する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 41, 44, 2005年02月03日
    動画像中の物体追跡では, 被覆の発生や陰影の変化により対象物体の輪郭線が得られず, 追跡精度が低下する場合がある.前フレームの結果によりその影響を低減する手法も提案されているが, 対象物体の撮像方向に変化が生じた場合には, 精度の向上に限界がある.そこで本文では, このような問題を解決するため, 形状に基づく分裂型Snakesを用いた動物体の追跡手法を提案する.形状に基づく分裂型Snakesは, 対象物体の本来の輪郭が一部得られない場合においても, その概形を表す参照輪郭の利用によって良好な抽出が可能である.提案手法では, 追跡対象のおよその3次元形状が与えられているとし, 直前のフレームにおける抽出結果とこの概形を比較することにより物体の撮像方向を推定し, 参照輪郭を設定する.これにより, 提案手法は撮像条件が時刻によって変化する環境下で撮像された動物体を高精度に追跡することが可能となる.本文の最後では, 提案手法を実際の動画像へ適用し, その有効性について評価を行う., 一般社団法人電子情報通信学会, 日本語
  • ファジィc-means法を用いたオーディオ信号の分割・分類法--音声及び音楽クラス間の距離の定義に関する考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 104, 648, 51, 56, 2005年02月03日
    ビデオ信号とオーディオ信号を統合した映像信号の検索システムを構築する際, 前処理として映像信号の分割・分類が必要となる.我々は, 以前, 映像信号のオーディオ部に着目し, オーディオ信号が切り換わる時刻(オーディオカット)を検出し, オーディオカットを境界とするセグメントを無音, 音声, 音楽, 音楽付き音声, 雑音付き音声の5種類のクラスに分類する手法を提案した.本稿では, 音楽付き音声に着目し, 音楽付き音声-音声間, 及び音楽付き音声-音楽間の距離(クラス間距離)をファジィc-means法より得られる帰属度を用いて表現する手法を提案する.提案手法により算出されるクラス間距離を用いることで, 音楽付き音声が音声, 音楽のどちらに類似した信号であるかを調べることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 静止画像中に存在する消失テクスチャの再構成に関する検討ERアルゴリズムの応用
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 75, 80, 2005年02月03日
    本文では, 位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失テクスチャの高精度な再構成法を提案する.提案手法では, 類似したテクスチャのフーリエ振幅が類似した値であることに着目し, 復元対象領域のフーリエ振幅に最も類似したテクスチャを含む領域を対象画像中から選択する.さらに, そのフーリエ振幅を用いて, 消失テクスチャの再構成を行う.このとき, 提案手法では消失テクスチャのフーリエ振幅特性が未知でありながら, それと類似した特性を持つ領域を選択するため, ERアルゴリズムにより発生する誤差を観察する.また, ERアルゴリズムの繰り返し処理において用いられる拘束条件の更新を行うことで, テクスチャの再構成に適した手法の改良が導入されている.このようにして導出される提案手法を用いれば, 対象画像中の既知のテクスチャのみから消失テクスチャの高精度な復元が可能となる.本文の最後では, 提案手法の有効性を示すために実験を行い, その復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • ニューラルネットワークを用いたサッカー映像のインデキシングに関する考察
    堤 公希, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 93, 98, 2005年02月03日
    サッカー映像のインデキシングを行うために, ロングショットと呼ばれるフィールドを広範囲に撮影した映像を検出する技術の開発は重要である.我々は以前, サッカー映像におけるフィールド, 及び選手が占める領域に注目し, ロングショットを検出する手法(以降, 従来手法)を提案した.しかしながら従来手法は, ロングショットの検出に用いる閾値を撮像環境によって変更する必要性があり, 設定が困難であるという問題があった.そこで本稿では, ニューラルネットワークを用いることにより, 閾値や撮影環境に依存しないロングショット検出を実現する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • ファジィクラスタリングを用いたサッカー映像におけるオーディオインデキシングに関する考察
    渡辺 隆志, 二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 99, 104, 2005年02月03日
    本稿では, テレビ放送のサッカー映像より得られるオーディオ信号を用いて, ゴールやファウル等, 試合の展開に深く関わるシーン(イベント)の発生時刻を検出する手法を提案する.提案手法では, イベント発生時に観客から歓声があがるという特徴に着目し, サッカー映像より得られるオーディオ信号から歓声のあがる時刻を検出することでイベント発生時刻を得る.テレビ放送のサッカー映像より得られるオーディオ信号にはアナウンサーの音声が含まれており, 歓声のみを得ることは困難である.そこで, 提案手法はサッカー映像より得られるオーディオ信号と, 歓声により構成された信号の類似の程度(歓声類似度)を, ファジィc-means法により得られる帰属度を用いて算出する.この歓声類似度に基づき歓声のあがる時刻を検出することで, イベント発生時刻を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 色彩と形状に着目した虹彩の自動抽出に関する検討
    金子 千晶, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 105, 110, 2005年02月03日
    顔画像に対して分離度フィルタを適用することにより, 虹彩や鼻孔などの円形状を呈する顔部品を抽出する手法が既に提案されている.しかしながら, このフィルタを用いて顔領域全体から虹彩のみを抽出しようとした場合, 鼻孔を誤って抽出する可能性がある.そこで本文では, 眉間を検出するために提案されているリング周波数フィルタを応用して分離度フィルタの適用範囲を限定することにより, 精度良く虹彩を抽出する手法を提案する.提案手法ではまず, 目が持つ色彩の特徴に基づき両目が存在する領域を推定する.この領域にリング周波数フィルタ適用することにより精度良く眉間の位置を求め, これを用いて左右の虹彩が存在する領域を推定する.こうして得られる領域にのみ分離度フィルタを適用することにより, 高精度に虹彩を抽出することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 救急救命アシスタンスのための携帯電話を用いた情報提供システムの構築
    佐久間 大輔, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 104, 646, 137, 142, 2005年02月03日
    本文は, 救急救命アシスタンスのための携帯電話を用いた情報提供システムを提案する.このシステムでは, ユーザが急患に対して行うべき救急救命の手順がアバタを用いて説明されるため, ユーザが容易に理解できる.また, アバタはSVG(Scalable Vector Graphics)で表現されており, 容量が小さく, 携帯電話に対して迅速に伝達される.さらに, 提案システムではアバタに加え, 手順を詳しく説明する音声, テキストも併せて提供する.これらのデータはSMIL(Synchronized Multimedia Integration Language)で統合された形式で携帯電話に伝送されるため, ユーザは容易に再生できる.また, 本文では, 携帯電話上で動作するSMILプレーヤを作製し, これを用いて救急救命手順の再生を確認する., 一般社団法人電子情報通信学会, 日本語
  • 姿勢の変化を考慮した高精度な歩行者追跡に関する考察
    松田 耕平, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 29, 34, 2005年02月03日
    本文では, 姿勢の変化にロバストな動画像中の歩行者の追跡手法を提案する.提案手法では, テンプレートマッチングによる追跡処理を行う際に, 歩行に伴う姿勢の変化を考慮するだけでなく, 歩行者領域に発生しているオクルージョンの有無を判定し, その精度を向上させる.具体的には, 姿勢の変化に応じたテンプレートを準備しておき, 過去のフレームにおける追跡結果から対象フレームにおける歩行者の姿勢を予測し, その姿勢に対応したテンプレートを用いてマッチングを行う.ここで, 追跡結果とテンプレートの差分を評価することで歩行者に対するオクルージョンの有無を判定し, オクルージョンの生じていない過去のフレームを用いて姿勢を予測することで, さらなる精度向上を目指す.以上のように導出された提案手法を用いることで, 歩行者の姿勢の変化を考慮した高精度な追跡を実現できる.本文の最後では, 実画像を用いた実験を行い, 提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像からのチーム優勢度の判定に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 35, 40, 2005年02月03日
    サッカーは多様な試合展開が存在し, 視聴者によっては試合展開を理解するのが困難な場合がある.したがって, 視聴者に試合展開を表現したデータを提示する技術が必要である.試合展開を表現する手段として, チームが得点できる可能性を表す, チームの優勢度があり, これをサッカー映像と共に視聴者に提示することができれば, サッカー映像が理解しやすいものとなる.そこで, 本稿では, 選手の行動をモデル化し, 作成されたモデルにより, チームの優勢度を判定する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 41, 44, 2005年02月03日
    動画像中の物体追跡では, 被覆の発生や陰影の変化により対象物体の輪郭線が得られず, 追跡精度が低下する場合がある.前フレームの結果によりその影響を低減する手法も提案されているが, 対象物体の撮像方向に変化が生じた場合には, 精度の向上に限界がある.そこで本文では, このような問題を解決するため, 形状に基づく分裂型Snakesを用いた動物体の追跡手法を提案する.形状に基づく分裂型Snakesは, 対象物体の本来の輪郭が一部得られない場合においても, その概形を表す参照輪郭の利用によって良好な抽出が可能である.提案手法では, 追跡対象のおよその3次元形状が与えられているとし, 直前のフレームにおける抽出結果とこの概形を比較することにより物体の撮像方向を推定し, 参照輪郭を設定する.これにより, 提案手法は撮像条件が時刻によって変化する環境下で撮像された動物体を高精度に追跡することが可能となる.本文の最後では, 提案手法を実際の動画像へ適用し, その有効性について評価を行う., 一般社団法人電子情報通信学会, 日本語
  • ファジィ c-means 法を用いたオーディオ信号の分割・分類法 : 音声及び音楽クラス間の距離の定義に関する考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 51, 56, 2005年02月03日
    ビデオ信号とオーディオ信号を統合した映像信号の検索システムを構築する際, 前処理として映像信号の分割・分類が必要となる.我々は, 以前, 映像信号のオーディオ部に着目し, オーディオ信号が切り換わる時刻(オーディオカット)を検出し, オーディオカットを境界とするセグメントを無音, 音声, 音楽, 音楽付き音声, 雑音付き音声の5種類のクラスに分類する手法を提案した.本稿では, 音楽付き音声に着目し, 音楽付き音声-音声間, 及び音楽付き音声-音楽間の距離(クラス間距離)をファジィc-means法より得られる帰属度を用いて表現する手法を提案する.提案手法により算出されるクラス間距離を用いることで, 音楽付き音声が音声, 音楽のどちらに類似した信号であるかを調べることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 静止画像中に存在する消失テクスチャの再構成に関する検討ERアルゴリズムの応用
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 75, 80, 2005年02月03日
    本文では, 位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失テクスチャの高精度な再構成法を提案する.提案手法では, 類似したテクスチャのフーリエ振幅が類似した値であることに着目し, 復元対象領域のフーリエ振幅に最も類似したテクスチャを含む領域を対象画像中から選択する.さらに, そのフーリエ振幅を用いて, 消失テクスチャの再構成を行う.このとき, 提案手法では消失テクスチャのフーリエ振幅特性が未知でありながら, それと類似した特性を持つ領域を選択するため, ERアルゴリズムにより発生する誤差を観察する.また, ERアルゴリズムの繰り返し処理において用いられる拘束条件の更新を行うことで, テクスチャの再構成に適した手法の改良が導入されている.このようにして導出される提案手法を用いれば, 対象画像中の既知のテクスチャのみから消失テクスチャの高精度な復元が可能となる.本文の最後では, 提案手法の有効性を示すために実験を行い, その復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • ニューラルネットワークを用いたサッカー映像のインデキシングに関する考察
    堤 公希, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 93, 98, 2005年02月03日
    サッカー映像のインデキシングを行うために, ロングショットと呼ばれるフィールドを広範囲に撮影した映像を検出する技術の開発は重要である.我々は以前, サッカー映像におけるフィールド, 及び選手が占める領域に注目し, ロングショットを検出する手法(以降, 従来手法)を提案した.しかしながら従来手法は, ロングショットの検出に用いる闘値を撮像環境によって変更する必要性があり, 設定が困難であるという問題があった.そこで本稿では, ニューラルネットワークを用いることにより, 闘値や撮影環境に依存しないロングショット検出を実現する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • ファジィクラスタリングを用いたサッカー映像におけるオーディオインデキシングに関する考察
    渡辺 隆志, 二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 99, 104, 2005年02月03日
    本稿では, テレビ放送のサッカー映像より得られるオーディオ信号を用いて, ゴールやファウル等, 試合の展開に深く関わるシーン(イベント)の発生時刻を検出する手法を提案する.提案手法では, イベント発生時に観客から歓声があがるという特徴に着目し, サッカー映像より得られるオーディオ信号から歓声のあがる時刻を検出することでイベント発生時刻を得る.テレビ放送のサッカー映像より得られるオーディオ信号にはアナウンサーの音声が含まれており, 歓声のみを得ることは困難である.そこで, 提案手法はサッカー映像より得られるオーディオ信号と, 歓声により構成された信号の類似の程度(歓声類似度)を, ファジィc-means法により得られる帰属度を用いて算出する.この歓声類似度に基づき歓声のあがる時刻を検出することで, イベント発生時刻を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 色彩と形状に着目した虹彩の自動抽出に関する検討
    金子 千晶, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 105, 110, 2005年02月03日
    顔画像に対して分離度フィルタを適用することにより, 虹彩や鼻孔などの円形状を呈する顔部品を抽出する手法が既に提案されている.しかしながら, このフィルタを用いて顔領域全体から虹彩のみを抽出しようとした場合, 鼻孔を誤って抽出する可能性がある.そこで本文では, 眉間を検出するために提案されているリング周波数フィルタを応用して分離度フィルタの適用範囲を限定することにより, 精度良く虹彩を抽出する手法を提案する.提案手法ではまず, 目が持つ色彩の特徴に基づき両目が存在する領域を推定する.この領域にリング周波数フィルタ適用することにより精度良く眉間の位置を求め, これを用いて左右の虹彩が存在する領域を推定する.こうして得られる領域にのみ分離度フィルタを適用することにより, 高精度に虹彩を抽出することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 救急救命アシスタンスのための携帯電話を用いた情報提供システムの構築
    佐久間 大輔, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 648, 137, 142, 2005年02月03日
    本文は, 救急救命アシスタンスのための携帯電話を用いた情報提供システムを提案する.このシステムでは, ユーザが急患に対して行うべき救急救命の手順がアバタを用いて説明されるため, ユーザが容易に理解できる.また, アバタはSVG (Scalable Vector Graphics)で表現されており, 容量が小さく, 携帯電話に対して迅速に伝達される.さらに, 提案システムではアバタに加え, 手順を詳しく説明する音声, テキストも併せて提供する.これらのデータはSMIL (Synchronized Multimedia Integration Language)で統合された形式で携帯電話に伝送されるため, ユーザは容易に再生できる.また, 本文では, 携帯電話上で動作するSMILプレーヤを作製し, これを用いて救急救命手順の再生を確認する., 一般社団法人電子情報通信学会, 日本語
  • ファジークラスタリングを用いたオーディオ信号の分割及び分類法
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 88, 2, 302, 312, 2005年02月01日
    本論文では, ファジーc-means法を用いてMPEG Audioで符号化されたオーディオ信号から, オーディオ信号の切り換わる時刻(オーディオカット)を検出し, それらを境界とするセグメント(オーディオセグメント)の分類を行う手法を提案する.従来の手法は, オーディオ信号から得られるエネルギーや零交差数等の特徴量に対し, しきい値処理を用いてオーディオカットを検出するため, フェードインやフェードアウト, クロスフェード等の音響効果が施された場合, 検出精度が低下する危険性があった.提案手法は, ファジーc-means法の導入により, その時刻にオーディオカットが存在する可能性を0から1までの実数で表現し, 存在する可能性がある時刻をオーディオカットの候補として検出する.このとき, 従来手法では検出が困難であった音響効果もオーディオカット候補として検出され, その結果, オーディオカットの未検出が軽減される.更に, それらの候補を境界とするオーディオセグメントを無音, 音声, 音楽, 音楽付き音声, 雑音付き音声の五つのクラスに分類し, これらの分類結果と併せて, 候補中の不要なオーディオカットを削除することにより, 高精度なオーディオカット検出を実現すると同時に, オーディオセグメントの分類を完了する., 一般社団法人電子情報通信学会, 日本語
  • A SIMPLE WORD SPOTTING METHOD BASED ON TEMPLATE MATCHING FOR SPEECH RETRIEVAL
    Komaki Noriko, Haseyama Miki, Yamamoto Tsuyoshi, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 544, 61, 66, 2005年01月03日
    This paper proposes a simple word spotting method for speech retrieval used for indexing and digesting for audio-visual contents. The proposed method retrieves desired words by using template-matching based on simple waveform features. Since the features can be computed with low computational costs, the proposed method executes the speech retrieval at high speed, which is actually 1/200 of the real-time speed. It is helpful in retrieving huge audio-visual database. Also experiments are performed by applying the proposed method to real audio signals, and the results are shown to verify its retrieval accuracy., 一般社団法人電子情報通信学会, 英語
  • A REGION MERGING METHOD FOR IMAGE SEGMENTATION
    Zhao Yanjun, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 104, 544, 79, 83, 2005年01月03日
    We propose in this paper a new merging method for image segmentation that reduces the number of generations over which intermediate, temporary results propagate. The proposed method consists of three major steps : preparation, batch merging and asynchronous update. In the step of preparation, the colors of two neighboring regions are compared. If their distance is smaller than a threshold, they are issued a merge label. The comparison is repeated for all neighboring pairs of regions. In the step of batch merging, a pair carrying a merge label is actually merged to create a new region. Some of the old merge labels will have to be cancelled according to the merged regions. In the step of asynchronous update, the merge labels between the new regions and their neighboring regions are updated. The steps of batch merging and asynchronous update will be repeated until there is no merge label., 一般社団法人電子情報通信学会, 英語
  • Accurate audio-segment classification using feature extraction matrix
    N Nitanda, M Haseyama, H Kitajima, 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5, III, 261, 264, 2005年
    This paper proposes an accurate audio signal classification method using feature extraction matrix. The proposed method classifies the segments of the audio signal into the following five audio classes: silence, speech, music, speech with music background, and speech with noise background. In this classification, a diagonal matrix, which is called feature extraction matrix, is utilized in order to extract the effective audio features for the classification. By using this feature extraction matrix, the five audio classes are clearly separated each other in the feature space, and thereby highly precise classification can be attained. Experimental results performed by applying the proposed method to real audio signals are shown to verify its high performance., IEEE, 英語
  • An algorithm for extracting lines directly from the input image to improve speed
    John W. Gates, Miki Haseyama, Hideo Kitajima, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 59, 2, 287, 295, 2005年
    This paper presents a fast and accurate line extraction algorithm. Conventional line extraction algorithms first extract the edge pixels and then connect these edge pixels into lines. In contrast the proposed algorithm extracts the lines directly from the input image by tracing the perimeter of an intensity region and then uses simple linear regression to compute the equations of the lines. This proposed method allows the algorithm to use the intensity information in the image to correlate the edge pixels, thus simplifying the computation of the lines and increasing the robustness in the presence of noise. Experiments were performed on a variety of synthetic and natural images and demonstrated that the algorithm can extract lines reliably, while realizing a large improvement in speed over the conventional algorithms., Inst. of Image Information and Television Engineers, 日本語
  • The extraction of circles from arcs represented by extended digital lines
    Euijin Kim, Miki Haseyama, Hideo Kitajima, IEICE Transactions on Information and Systems, E88-D, 2, 252, 267, 2005年
    This paper presents a new fast and robust circle extraction method that is capable of extracting circles from images with complicated backgrounds. It is not based on the Hough transform (HT) that requires a time-consuming voting process. The proposed method uses a least-squares circle fitting algorithm for extracting circles. The arcs are fitted by extended digital lines that are extracted by a fast line extraction method. The proposed method calculates accurate circle parameters using the fitted arcs instead of evidence histograms in the parameter space. Tests performed on various real-world images show that the proposed method quickly and accurately extracts circles from complicated and heavily corrupted images. Copyright © 2005 The Institute of Electronics, Information and Communication Engineers., Institute of Electronics, Information and Communication, Engineers, IEICE, 英語
  • A new conic section extraction approach and its applications
    John Gates, Miki Haseyama, Hideo Kitajima, IEICE Transactions on Information and Systems, E88-D, 2, 239, 251, 2005年
    This paper presents a new conic section extraction approach that can extract all conic sections (lines, circles, ellipses, parabolas and hyperbolas) simultaneously. This approach is faster than the conventional approaches with a computational complexity that is O(n), where n is the number of edge pixels, and is robust in the presence of moderate levels of noise. It has been combined with a classification tree to produce an offline character recognition system that is invariant to scale, rotation, and translation. The system was tested with synthetic images and with images scanned from real world sources with good results. Copyright © 2005 The Institute of Electronics, Information and Communication Engineers., Institute of Electronics, Information and Communication, Engineers, IEICE, 英語
  • A robust human-eye tracking method in video sequences
    M Haseyama, C Kaneko, 2005 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP), VOLS 1-5, 2, 1445, 1448, 2005年
    An accurate tracking method of the human eyes in video sequence is proposed. The method consists of the following two systems. (1) The first system extracts a region including the both eyes by using a statistical processing. By the processing, the extracted region does not include the other features, especially such as the hair. (2) The second system, which is realized with the circle-frequency filter (CFF), locates each eye position from the region extracted by the first system. Since the output of the CFF is robust to luminescent noise near the eyes, it can successfully obtain the exact eye-location inside of the above region without any noise effect. Consequently, the combination of these two systems makes the proposed method correctly track the eyes without any learning schemes, templates, and geometric relations of the other facial features. Experimental results verify that the proposed method achieves accurate eye-tracking., IEEE, 英語
  • Reconstruction method of missing texture using error reduction algorithm
    T Ogawa, M Haseyama, H Kitajima, 2005 International Conference on Image Processing (ICIP), Vols 1-5, 2, 1389, 1392, 2005年
    This paper presents a novel reconstruction method of missing textures using an error reduction algorithm which is one of phase retrieval methods. The proposed method estimates the Fourier transform magnitude of the missing area from another area whose texture is similar in the obtained image. In order to realize this, a novel approach that monitors the errors caused by the error reduction algorithm is introduced into the selection scheme of the similar texture. Further, the proposed method estimates the phase of the target area by using the error reduction algorithm modified for the texture reconstruction and can restore the missing area accurately. Some experimental results show that the proposed method achieves more accurate restoration than that of the traditional methods., IEEE, 英語
  • GA-based applications for routing with an upper bound constraint
    Jun Inagaki, Miki Haseyama, Proceedings - IEEE International Symposium on Circuits and Systems, 2239, 2242, 2005年
    This paper presents a method of searching for the shortest route via the most designated points among the routes whose lengths are less than the upper bound using a genetic algorithm (GA). If chromosomes whose route lengths exceed the upper bound are simply screened out in the GA process, the optimization probability gets worse. For the purpose of solving this problem, this paper proposes a new fitness function including an upper bound constraint which can be flexibly changed during the searching process. By using this function, the optimum is efficiently obtained and the optimization probability can be raised. Furthermore, the effectiveness of the proposed method is verified by the experiments applying it to the actual map data. © 2005 IEEE., IEEE, 英語
  • Quality improvement technique for JPEG images with fractal image coding
    Megumi Takezawa, Hirofumi Sanada, Kazuhisa Watanabe, Miki Haseyama, Proceedings - IEEE International Symposium on Circuits and Systems, 6320, 6323, 2005年
    This paper proposes a quality improvement technique for JPEG images by using fractal image coding. JPEG coding is a commonly used standard method of compressing images. However, in its decoded images, quantization noise is sometimes visible in high frequency regions, such as the edges of objects. Hence, in order for the JPEG coding to become a more powerful image-coding method, the JPEG image quality must be improved. Therefore, our method solves this problem by adding the obtained codes by the fractal image coding to improve the image quality. Some simulation results verify that the proposed method achieved higher coding-performance than the traditional JPEG coding. © 2005 IEEE., 英語
  • Audio signal segmentation and classification for scene-cut detection
    Naoki Nitanda, Miki Haseyama, Hideo Kitajima, Proceedings - IEEE International Symposium on Circuits and Systems, 4030, 4033, 2005年
    A scene is regarded as a basic unit of audiovisual material, and thereby the boundaries between two adjacent scenes, which are called scene-cuts, must be detected in advance for audiovisual indexing. This paper proposes a scenecut detection method. Since scene-cuts are associated with a simultaneous change of visual and audio characteristics, both audio and visual analyses are required for the scene-cut detection. For the audio signal analysis, the proposed method utilizes an audio signal segmentation and classification method using fuzzy c-means clustering, which has been proposed by the authors. For the visual signal analysis, the proposed method utilizes some visual segmentation methods. By using these methods simultaneously, the proposed method can accurately detect the scene-cuts, and thereby it is highly valuable for the preprocessing of the audiovisual indexing. Experimental results performed by applying the proposed method to real audiovisual material are shown to verify its high performance. © 2005 IEEE., IEEE, 英語
  • Restoration method of missing areas in still images using GMRF model
    Takahiro Ogawa, Miki Haseyama, Hideo Kitajima, Proceedings - IEEE International Symposium on Circuits and Systems, 4931, 4934, 2005年
    This paper proposes a GMRF-model based restoration method of missing areas in still images. The GMRF model used in the proposed method is realized by a new assumption that reasonably holds for an image source. This model can express important image features such as edges because of the use of the new assumption. Therefore, the proposed method restores the missing areas using the modified GMRF model and can correctly reconstruct the missing edges. Consequently, the proposed method achieves more accurate restoration than those of the traditional methods on both objective and subjective measures. Extensive experimental results demonstrate the improvement of the proposed method over the previous methods. © 2005 IEEE., IEEE, 英語
  • Effective apoptotic cell extraction from video microscopy images
    M Haseyama, Y Sasamura, 2005 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOLS 1-5, II, 461, 464, 2005年
    This paper presents an automatic extraction method for apoptotic cells from video microscopy images. Apoptosis, which is also called programmed cell death, is well-known to be closely related with various diseases. Detection of apoptotic cells can help scientists to study apoptosis and to reveal its mechanism, so that new medical technologies can be exploited. Scientists often analyze the images acquired with video microscopes with some sort of image analysis tools. However, it is usual that the performance of the tools is not enough to thoroughly detect the apoptotic cells, thus the researchers have to manually detect the apoptotic cells from the images. This paper proposes a method to automatically detect the apoptotic cells based on their inherent shape features. The proposed method is applied to real world video microscopy images containing apoptotic cells and the results demonstrate its high performance to successfully extract the cells., IEEE, 英語
  • Moving object extraction using a shape-constraint-based splitting active contour model
    M Haseyama, Y Yokoyama, 2005 International Conference on Image Processing (ICIP), Vols 1-5, 3, 2681, 2684, 2005年
    This paper proposes an efficient moving object extraction method based on an active contour model, which is usually called a Snake. The previous Snakes cannot extract multiple objects inside one contour, since they require that one initial contour can only include one object. Such a restriction becomes a problem for moving object extraction application, because an initial contour may contain more than one object including not only the extraction target but also other objects. To deal with this kind of problem, the proposed method utilizes a new splitting mechanism. By incorporating this mechanism, the proposed Snake can successfully extract each of the multiple objects located inside one initial contour. The experiments of extracting moving vehicles from actual image sequences verify the effectiveness and high performance of the proposed method., IEEE, 英語
  • An audio signal segmentation and classification using fuzzy c-means clustering
    Naoki Nitanda, Miki Haseyama, Hideo Kitajima, Proceedings of the Second International Conference on Information Technology and Applications (ICITA 2004), 332, 337, 2004年12月27日
    This paper proposes an audio signal segmentation and classification method using fuzzy c-means clustering. Recently, high performance of the audio signal segmentation and classification is required for audio-visual indexing because of the popular use of the Internet, higher bandwidth access to the network, widespread of digital recording and storage; and several methods have been proposed. They segment the audio signal at boundaries between two different audio signals, which are called audio-cuts, and then classify the audio signal into basic audio classes such as speech, music, etc. However, since most of the methods utilize thresholding for the audio-cut detection, they cannot provide high accuracy because of several audio effects, such as fade-In, fade-out, cross-fade, etc. To overcome this problem, we utilize the fuzzy c-means clustering. The possibility that the audio-cut exists is represented by the fuzzy number, and thus we can detect audio-cuts accurately. After the segmentation, the audio signal is classified into audio classes. This classification results are utilized for verification processing of the audio-cuts, so that segmentation and classification errors are reduced. Experimental results performed by applying the proposed method to real audio signals are shown to verify its high performance.
  • ビデオ顕微鏡画像におけるアポトーシス細胞の抽出手法
    長谷山 美紀, 笹村 ゆかり, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 87, 11, 2045, 2053, 2004年11月01日
    ビデオ顕微鏡により得られた画像からアポトーシスに至る細胞のみを自動抽出する手法を提案する.ビデオ顕微鏡により取得された細胞像は,観察の際に使用される蛍光酵素によって,エッジが緩やかで太く,その形状は円形に類似しているものの各所にゆがみをもち,かつ,対象細胞以外の細胞が隣接して存在する.そのため,容易に自動検出することができず,その解析は目視に依存していた.そこで,本論文では,このような観察条件と固有の形状に適した形状解析を行うことによって,所望の細胞のみを検出する手法を提案する.また,提案手法は,画像全体に詳細な形状解析を施すのではなく,検出対象細胞を合む可能性がある領域を検出し,検出された領域の内部にのみ詳細な形状解析を行う.このような2段階の処理により,計算量の増加を避けながら,高い検出精度を維持する.また,時間軸上に連続した動画像として観察された場合に,各フレームの検出結果を比較することによって,抽出精度の更なる向上を図る.本論文の最後では実際に得られた顕微鏡像を用いて,アポトーシスに至る細胞の抽出を行い,提案手法の有効性について検討する., 一般社団法人電子情報通信学会, 日本語
  • オプティカルフローを用いた静止画像における失われた輝度値の復元
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 87, 9, 1786, 1795, 2004年09月01日
    論文では,オプティカルフローを用いた静止画像の輝度値の高精度な復元手法を提案する.画像の失われた輝度値の復元において,エッジ部を正確に再構成することは重要な課題である.そこで本論文では,従来より動画像の動き解析に利用されているオプティカルフローを,静止画像に適用可能な形に変更し,これを用いることで輝度値の高精度な復元を行う.また,より高精度な推定輝度値を与えるオプティカルフローを算出するために,提案手法では画素間の輝度値の相関に着眼した新たな指標を導入する.この指標を用いて算出されるオプティカルフローは輝度値が失われた画素の近傍に存在する画素から,より真の輝度値に類似した画素を選択することを可能とし,輝度値が大きく異なる画素の影響を受けずに復元できる.これにより,特にエッジ部分における復元精度が向上するだけでなく,従来の復元手法では困難であった輝度値の失われた領域を複数のエッジが通過する場合や,通過するエッジの方向がその領域内で大きく変化する場合にも,正確に失われたエッジの再構成を行うことが可能となる.本論文の最後では実験を行い,提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • I-023 可変観測窓を用いた歩行者の頭部検出(I.画像認識・メディア理解)
    川瀬 慎司, 金 義鎮, 藤井 敏史, 長谷山 美紀, 北島 秀夫, 情報科学技術フォーラム一般講演論文集, 3, 3, 49, 51, 2004年08月20日
    FIT(電子情報通信学会・情報処理学会)運営委員会, 日本語
  • 高次ニューラルネットワークにおける Dynamic Coalescence Model 動作機序の擬似実現
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. HIP, ヒューマン情報処理, 103, 744, 19, 24, 2004年03月19日
    本論文は,クラスタリング手法DCM(Dynamic Coalescence Model)における単位時間毎の点移動の性質(静特性)に基づく特徴ベクトル変換系,DCMの再帰動作機序が導く点分布変換の性質(動特性)に基づく(類似・未知)の追加学習パターン生成系,および改良型識別系HONNから構成される認識系の認識率が,学習パターン数が少ない場合高くない欠点を改善する.追加学習特徴ベクトルの生成手法を提案する.提案手法は各学習パターン(点分布)の概略を表すベクトルを,遠い距離にある2点関係のみを用い,理論的に確実かつ容易に複数生成する.それらは点分布がもつ様々な性質を表現するため,特に学習パターン数が少ない場合の認識率を改善する.具体例として分布同定および手書き文字認識を取り上げ,提案手法の有効性を実験的に考察する., 一般社団法人電子情報通信学会, 日本語
  • D-14-12 連続音声に対するワードスポッティングに関する検討(D-14. 音声・聴覚)
    小牧 憲子, 長谷山 美紀, 山本 強, 電子情報通信学会総合大会講演論文集, 2004, 1, 153, 153, 2004年03月08日
    一般社団法人電子情報通信学会, 日本語
  • A cost-effective CORDIC-based architecture for adaptive lattice filters
    S Shiraishi, M Haseyama, H Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E87A, 3, 567, 576, 2004年03月
    This paper presents a cost-effective CORDIC-based architecture for adaptive lattice filters. An implementation method for an ARMA lattice filter using the CORDIC algorithm has been proposed. The previously proposed method can provide a simple filter architecture; however, it has problems such as redundant structure and numerical inaccuracy. Therefore, by solving each problem we derive a new non-redundant filter architecture with improved numerical accuracy. The obtained filter architecture provides a low cost ARMA lattice filter in which high-precision data processing is feasible. In addition, the proposed architecture can be applied to AR-type lattice filters, so that it may have several applications in adaptive signal processing. The presented filter architecture is useful from a hardware point of view because it facilitates an effective VLSI design of various adaptive lattice filters., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • A significant property of mapping parameters for signal interpolation using fractal interpolation functions
    S Uemura, M Haseyama, H Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E87A, 3, 748, 752, 2004年03月
    This letter presents a significant property of the mapping parameters that play a central role to represent a given signal in Fractal Interpolation Functions (FIF). Thanks to our theoretical analysis, it is derived that the mapping parameters required to represent a given signal are also applicable to represent the upsampled signal of a given one. Furthermore, the upsampled signal obtained by using the property represents the self-affine property more distinctly than the given signal. Experiments show the validity and usefulness of the significant property., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語, 速報,短報,研究ノート等(学術雑誌)
  • 両目検出のためのリング周波数フィルタの応用について
    金子 千晶, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 8, 1, 6, 2004年02月04日
    映像情報メディア学会, 日本語
  • スケールスペースフィルタリングを用いたテクスチャ画像の識別に関する考察
    石田 智也, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 8, 25, 30, 2004年02月04日
    映像情報メディア学会, 日本語
  • SVMを用いた歩行者追跡の高精度化に関する考察
    松田 耕平, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 8, 45, 50, 2004年02月04日
    映像情報メディア学会, 日本語
  • ステレオカメラの姿勢変化による生じる計測誤差の考察
    脇 寛尚, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 8, 95, 100, 2004年02月04日
    映像情報メディア学会, 日本語
  • 集団意思決定理論に基づいたナーススケジューリング問題の解法に関する一考察
    中島 純, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 7, 43, 48, 2004年02月03日
    映像情報メディア学会, 日本語
  • シーンカット検出を目的としたオーディオビジュアルインデキシングに関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 7, 119, 124, 2004年02月03日
    映像情報メディア学会, 日本語
  • サッカー映像におけるロングショット検出に関する一考察
    堤 公希, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 7, 125, 130, 2004年02月03日
    映像情報メディア学会, 日本語
  • カラー画像の性質に着目したJPEG復号画像の品質向上に関する一考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 6, 7, 12, 2004年02月02日
    映像情報メディア学会, 日本語
  • 輝度値消失領域の復元に関する検討GMRFモデルの応用
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 28, 6, 19, 24, 2004年02月02日
    映像情報メディア学会, 日本語
  • A novel contour description with expansion ability using extended fractal interpolation functions
    S Uemura, M Haseyama, H Kitajima, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E87D, 2, 453, 462, 2004年02月
    In this paper, a novel description method of the contour of a shape using extended fractal interpolation functions (EFIFs) is presented. Although the scope of application of traditional FIFs has been limited to cases in which a given signal is represented by a single-valued function, the EFIFs derived by the introduction of a new parameter can describe a multiple-valued signal such as the contour of a shape with a high level of accuracy. Furthermore, the proposed description method possesses the useful property that once a given contour has been modeled by the proposed description method, the shape can be easily expanded at an arbitrary expansion rate. Experimental results show the effectiveness and usefulness of the proposed description method for representing contours., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • 両目検出のためのリング周波数フィルタの応用について
    金子 千晶, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 641, 1, 6, 2004年01月28日
    顔画像に対してリング周波数フィルタを適用することにより,眉間を検出する手法が既に提案されている.本文では,このリング周波数フィルタを用いて顔の回転角度も知ることができることに着目し,両目が存在する領域に対してこのフィルタを応用することにより,目の位置を検出する手法を提案する.提案手法では,まず目が持つ色彩の特徴に基づき,両目が存在する領域を推定する.得られた領域に対してのみ上記のフィルタを適用することにより,精度良く眉間の位置と顔の回転角度を求め,それらを用いて目の位置を検出する.これにより,学習パターンやテンプレートを用いずに高精度に目の位置を検出することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • スケールスペースフィルタリングを用いたテクスチャ画像の識別に関する考察
    石田 智也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 641, 25, 30, 2004年01月28日
    テクスチャ画像にスケールスペースフィルタリングを施して得られる平滑化画像を用いて,ボケあるいはノイズに頑健な特徴量を算出する手法が既に提案されている.この手法では,スケールと呼ばれる平滑化の度合を示すパラメータを連続的に変化させることにより,様々な平滑化画像を作成し,それらの中からテクスチャの特徴をより明確に表す画像を選択して特徴量を算出する.しかしながら,そのような画像の選択は経験的に行われており,選択によっては,テクスチャの特徴を表していない特徴量が算出される場合がある.そこで,本稿では,平滑化画像における,濃淡曲面上の法線ベクトルを評価基準とすることで,対象となるテクスチャ画像からテクスチャの特徴を明確に表す平滑化画像を選択する方法を提案する., 一般社団法人電子情報通信学会, 日本語
  • SVMを用いた歩行者追跡の高精度化に関する考察
    松田 耕平, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 641, 45, 50, 2004年01月28日
    本文では,動画像におけるオクルージョンの影響を受けない歩行者の追跡手法を提案する.高精度な歩行者追跡を行うには,電柱,木々等の静止物体および歩行者同士の重なりにより発生するオクルージョンによる追跡精度の劣化をさける必要がある.提案手法は,Support Vector Machine(SVM)を用いて,追跡の対象である歩行者がオクルージョンの影響を受けているか否かを判定する.オクルージョンの影響を受けていた場合,過去のオクルージョンの影響を受けていないフレームにおける歩行者の濃淡値をテンプレートマッチングに用いる.これにより,オクルージョンの影響を受けない高精度な歩行者追跡が可能となる., 一般社団法人電子情報通信学会, 日本語
  • ステレオカメラの姿勢変化により生じる計測誤差の考察
    脇 寛尚, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 641, 95, 100, 2004年01月28日
    ステレオ画像処理により対象物体の正確な位置を得るためには,精密なカメラ校正が必要である.しかしながら,車載のステレオカメラでは,部品の経時変化や走行時に受ける振動により,カメラの姿勢や位置が変化し,対象物体の位置の計測結果に誤差が生じる場合がある.そこで本稿では,カメラの姿勢変化が対象物体の位置の計測結果に与える影響について考察する., 一般社団法人電子情報通信学会, 日本語
  • 両目検出のためのリング周波数フィルタの応用について
    金子 千晶, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 644, 1, 6, 2004年01月28日
    顔画像に対してリング周波数フィルタを適用することにより,眉間を検出する手法が既に提案されている.本文では,このリング周波数フィルタを用いて顔の回転角度も知ることができることに着目し,両目が存在する領域に対してこのフィルタを応用することにより,目の位置を検出する手法を提案する.提案手法では,まず目が持つ色彩の特徴に基づき,両目が存在する領域を推定する.得られた領域に対してのみ上記のフィルタを適用することにより,精度良く眉間の位置と顔の回転角度を求め,それらを用いて目の位置を検出する.これにより,学習パターンやテンプレートを用いずに高精度に目の位置を検出することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • スケールスペースフィルタリングを用いたテクスチャ画像の識別に関する考察
    石田 智也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 644, 25, 30, 2004年01月28日
    テクスチャ画像にスケールスペースフィルタリングを施して得られる平滑化画像を用いて,ボケあるいはノイズに頑健な特徴量を算出する手法が既に提案されている.この手法では,スケールと呼ばれる平滑化の度合を示すパラメータを連続的に変化させることにより,様々な平滑化画像を作成し,それらの中からテクスチャの特徴をより明確に表す画像を選択して特徴量を算出する.しかしながら,そのような画像の選択は経験的に行われており,選択によっては,テクスチャの特徴を表していない特徴量が算出される場合がある.そこで,本稿では,平滑化画像における,濃淡曲面上の法線ベクトルを評価基準とすることで,対象となるテクスチャ画像からテクスチャの特徴を明確に表す平滑化画像を選択する方法を提案する., 一般社団法人電子情報通信学会, 日本語
  • SVMを用いた歩行者追跡の高精度化に関する考察
    松田 耕平, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 644, 45, 50, 2004年01月28日
    本文では,動画像におけるオクルージョンの影響を受けない歩行者の追跡手法を提案する.高精度な歩行者追跡を行うには,電柱,木々等の静止物体および歩行者同士の重なりにより発生するオクルージョンによる追跡精度の劣化をさける必要がある.提案手法は,Support Vector Machine(SVM)を用いて,追跡の対象である歩行者がオクルージョンの影響を受けているか否かを判定する.オクルージョンの影響を受けていた場合,過去のオクルージョンの影響を受けていないフレームにおける歩行者の濃淡値をテンプレートマッチングに用いる.これにより,オクルージョンの影響を受けない高精度な歩行者追跡が可能となる., 一般社団法人電子情報通信学会, 日本語
  • ステレオカメラの姿勢変化により生じる計測誤差の考察
    脇 寛尚, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 644, 95, 100, 2004年01月28日
    ステレオ画像処理により対象物体の正確な位置を得るためには,精密なカメラ校正が必要である.しかしながら,車載のステレオカメラでは,部品の経時変化や走行時に受ける振動により,カメラの姿勢や位置が変化し,対象物体の位置の計測結果に誤差が生じる場合がある.そこで本稿では,カメラの姿勢変化が対象物体の位置の計測結果に与える影響について考察する., 一般社団法人電子情報通信学会, 日本語
  • 集団意思決定理論に基づいたナーススケジューリング問題の解法に関する一考察
    中島 純, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 640, 43, 48, 2004年01月27日
    ナーススケジューリング問題(Nurse Scheduling Problem:NSP)とは,苛酷な勤務の回避や,必要な勤務者数の確保等の制約条件のもとで,各看護師の勤務表を作成する問題である.この問題に対して,遺伝的アルゴリズム(Genetic Algorithm:GA)を用いた解法が既に提案されている.しかしながら,従来手法では,全ての看護師に平等な勤務表の作成,及び,看護師の勤務に対する好みを反映した勤務表の作成は困難である.そこで,本稿では,集団意思決定理論に基づいたNSPの解法を提案する.これにより,全ての看護師に平等な勤務表の作成が可能となる.さらに,提案手法では,意思決定手法の一つであるAHP(Analytic Network Process)を導入することにより,看護師の勤務に対する好みを反映した勤務表の作成を可能とする., 一般社団法人電子情報通信学会, 日本語
  • シーンカット検出を目的としたオーディオビジュアルインデキシングに関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 640, 119, 124, 2004年01月27日
    ビデオ信号とオーディオ信号を統合したオーディオビジュアル信号の分割・インデキシングは,データベースや検索システムを構築する上で必要とされる重要な技術である.我々は,以前,オーディオビジュアル信号のオーディオ部に着目し,オーディオ信号が切り換わる時刻(オーディオカット)を検出し,オーディオカットを境界とするセグメントを無音,音声,音楽,背景音付き音声の4つのクラスに分類する手法を提案した.本稿では,オーディオ信号の分類において,背景音付き音声をさらに音楽付き音声と雑音付き音声に分類し,より実用的なオーディオ信号の分類を実現する.また,従来より提案されているビデオ信号を用いたカット点検出手法と,我々のオーディオカット検出手法を組み合わせ,異なるシーンの境界であるシーンカットを検出する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるロングショット検出に関する一考察
    堤 公希, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 640, 125, 130, 2004年01月27日
    サッカー映像のインデキシングを行うために,ロングショットと呼ばれる,フィールドを広範囲に撮影した映像を検出する技術の開発は重要である.しかしながら,従来手法の多くは,選手の位置の検出やゲーム内容の要約に主眼を置いており,ロングショットの検出のみに着眼した手法は少ない.そのため,従来手法におけるロングショットの検出精度は充分とは言えない.そこで,本稿では,撮影された映像におけるフィールド,及び選手が占める領域に注目し,ロングショットを高精度に検出する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 集団意思決定理論に基づいたナーススケジューリング問題の解法に関する一考察
    中島 純, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 643, 43, 48, 2004年01月27日
    ナーススケジューリング問題(Nurse Scheduling Problem:NSP)とは,苛酷な勤務の回避や,必要な勤務者数の確保等の制約条件のもとで,各看護師の勤務表を作成する問題である.この問題に対して,遺伝的アルゴリズム(Genetic Algorithm:GA)を用いた解法が既に提案されている.しかしながら,従来手法では,全ての看護師に平等な勤務表の作成,及び,看護師の勤務に対する好みを反映した勤務表の作成は困難である.そこで,本稿では,集団意思決定理論に基づいたNSPの解法を提案する.これにより,全ての看護師に平等な勤務表の作成が可能となる.さらに,提案手法では,意思決定手法の一つであるAHP( Analytic Network Process)を導入することにより,看護師の勤務に対する好みを反映した勤務表の作成を可能とする., 一般社団法人電子情報通信学会, 日本語
  • シーンカット検出を目的としたオーディオビジュアルインデキシングに関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 643, 119, 124, 2004年01月27日
    ビデオ信号とオーディオ信号を統合したオーディオビジュアル信号の分割・インデキシングは,データベースや検索システムを構築する上で必要とされる重要な技術である.我々は,以前,オーディオビジュアル信号のオーディオ部に着目し,オーディオ信号が切り換わる時刻(オーディオカット)を検出し,オーディオカットを境界とするセグメントを無音,音声,音楽,背景音付き音声の4つのクラスに分類する手法を提案した.本稿では,オーディオ信号の分類において,背景音付き音声をさらに音楽付き音声と雑音付き音声に分類し,より実用的なオーディオ信号の分類を実現する.また,従来より提案されているビデオ信号を用いたカット点検出手法と,我々のオーディオカット検出手法を組み合わせ,異なるシーンの境界であるシーンカットを検出する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • サッカー映像におけるロングショット検出に関する一考察
    堤 公希, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 643, 125, 130, 2004年01月27日
    サッカー映像のインデキシングを行うために,ロングショットと呼ばれる,フィールドを広範囲に撮影した映像を検出する技術の開発は重要である.しかしながら,従来手法の多くは,選手の位置の検出やゲーム内容の要約に主眼を置いており,ロングショットの検出のみに着眼した手法は少ない.そのため,従来手法におけるロングショットの検出精度は充分とは言えない.そこで,本稿では,撮影された映像におけるフィールド,及び選手が占める領域に注目し,ロングショットを高精度に検出する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • カラー画像の性質に着目したJPEG復号画像の品質向上に関する一考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 639, 7, 12, 2004年01月26日
    JPEGにより画像を符号化すると,エッジ等の高周波成分を含む領域に量子化誤差が目立つ場合がある.特に,カラー画像では,輝度成分の量子化誤差が目立つことが知られている.そこで本文では,この問題を解決するために,高周波領域に対して輝度成分の量子化誤差を縮小する符号を付加し,復号画質を向上させる手法を提案する.提案手法では,量子化誤差を縮小するために付加する符号を,フラクタル画像符号化を用いて算出することで,符号量の増加を抑えている.その結果,提案手法を用いることによって,効率的にJPEGの復号画像の品質を向上させることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 輝度値消失領域の復元に関する検討GMRFモデルの応用
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 103, 639, 19, 24, 2004年01月26日
    本文では,GMRFモデルを用いた静止画像における輝度値消失領域の高精度な復元手法を提案する.輝度値消失領域の復元において,エッジ部を正確に再構成することは重要な課題である.そこで我々は,GMRFモデルを用いてエッジを高精度に復元する手法を実現する.提案手法で用いるGMRFモデルは,エッジを含む画像の高精度なモデル化を可能とするため,画像が複数の弱定常な確率過程により構成されるという仮定に基づいて定義されている.このようなモデルを用いることにより,輝度値消失領域の高精度な復元が可能となる.本文の最後では,提案手法の有効性を示すために実験を行い,その復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • カラー画像の性質に着目したJPEG復号画像の品質向上に関する一考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 642, 7, 12, 2004年01月26日
    JPEGにより画像を符号化すると,エッジ等の高周波成分を含む領域に量子化誤差が目立つ場合がある.特に,カラー画像では,輝度成分の量子化誤差が目立つことが知られている.そこで本文では,この問題を解決するために,高周波領域に対して輝度成分の量子化誤差を縮小する符号を付加し,復号画質を向上させる手法を提案する.提案手法では,量子化誤差を縮小するために付加する符号を,フラクタル画像符号化を用いて算出することで,符号量の増加を抑えている.その結果,提案手法を用いることによって,効率的にJPEGの復号画像の品質を向上させることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 輝度値消失領域の復元に関する検討GMRFモデルの応用
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 642, 19, 24, 2004年01月26日
    本文では,GMRFモデルを用いた静止画像における輝度値消失領域の高精度な復元手法を提案する.輝度値消失領域の復元において,エッジ部を正確に再構成することは重要な課題である.そこで我々は,GMRFモデルを用いてエッジを高精度に復元する手法を実現する.提案手法で用いるGMRFモデルは,エッジを含む画像の高精度なモデル化を可能とするため,画像が複数の弱定常な確率過程により構成されるという仮定に基づいて定義されている.このようなモデルを用いることにより,輝度値消失領域の高精度な復元が可能となる.本文の最後では,提案手法の有効性を示すために実験を行い,その復元性能を評価する., 一般社団法人電子情報通信学会, 日本語
  • GA及びSAを用いた有限語長フィルタの設計に関する一考察
    松浦 大樹, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 103, 568, 7, 12, 2004年01月15日
    ディジタルフィルタを有限語長で実現する場合,演算結果の量子化に起因する出力誤差及び係数量子化による周波数特性の劣化が問題となる.本文では,これらの問題を同時に解決する手法を提案する.提案手法では,デルタオペレータを用いて縦続形フィルタを設計することにより,前者の問題を解決する.そして,後者の問題を解決するために,GA及びSAを用いてフィルタ係数の量子化を行う.また,実験により提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 英語
  • CORDIC実現された適応ARMAラティスフィルタの収束特性
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 103, 568, 13, 18, 2004年01月15日
    本文ではCORDIC ARMAラティスフィルタの収束特性解析を行う.適応ラティスフィルタの収束特性については,すでにいくつかの解析手法が提案されているが,これらはいずれもARラティスフィルタに対するものであった.これに対し,本文で提案する手法は,ARMA型ラティスフィルタの収束特性解析を目的としたものである.本文では,二種類のモデル(収束モデル,定常状態モデル)を導出し,これを用いてCORDIC ARMAラティスフィルタの収束特性を明らかにする.得られる解析結果は,フィルタをハードウェア実現する際の適切なステップサイズ設定の指標とすることができ,有用である., 一般社団法人電子情報通信学会, 日本語
  • GA-BASED MOTION TABLE REALIZATION FOR EFFICIENT VIDEO CODING
    Asamizu Satoshi, Haseyama Miki, 電子情報通信学会技術研究報告. IE, 画像工学, 103, 539, 47, 51, 2004年01月05日
    This paper proposes a motion-table realization method for efficiently and high quality motion compensation. The proposed motion table is realized by using a genetic algorithm (GA) based on a fitness function which is defined by both the prediction image quality and the bit rate to represent motion vectors. According to this fitness function, the GA searches all the possible motion vectors for the necessary vectors; that is to say, by using a motion table including only the necessary vectors, we can obtain a high quality prediction image without increasing the bit rate. Since the previous methods do not directly search for the motion vectors which provide the prediction image quality with the low bit rate; therefore, our approach is not only novel but also provide high quality prediction image. In this paper, we apply the proposed method to actual motion pictures to verify its effectiveness. Furthermore, some of the previous methods not including GA are applied to the same pictures, and the results are compared to our results. This comparison also shows that the proposed method is more effective than the others., 一般社団法人電子情報通信学会, 英語
  • 高能率な動き補償のためのGAを用いた高速探索法の検討
    浅水仁, 長谷山美紀, 画像センシングシンポジウム講演論文集, 10th, 2004年
  • A convergence model for a cordic-based ARMA lattice filter
    S Shiraishi, M Haseyama, H Kitajima, 2004 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL 3, PROCEEDINGS, 3, 301, 304, 2004年
    This paper presents a convergence model for a CORDIC-based ARMA lattice filter. In previous works, several convergence analyses have been discussed; however, they are available only for ARtype filters. On the other hand, our convergence model reveals convergence properties of an adaptive ARMA lattice filter. The results of the analysis facilitates an efficient ASIC design of the ARMA lattice filter. In addition, we can apply the presented analysis techniques to multiplier-based ARMA lattice filters, so that they can be utilized for many applications in the digital signal processing field., IEEE, 英語
  • An audio-scene cut detection method using fuzzy c-means algorithm for audio-visual indexing
    N Nitanda, M Haseyama, H Kitajima, 2004 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL 2, PROCEEDINGS, 2, 89, 92, 2004年
    This paper proposes an accurate audio-scene cut detection method. The audio-scene denotes a segment which is constructed of semantically correlated audio-shots, where the audio-shot is a smaller segment than the audio-scene; and the boundary between two audio-scenes and that between two audio-shots are called the audio-scene cut and the audio-shot cut, respectively. Recently, high performance of the audio-scene cut detection methods is required for the audio-visual indexing; and several detection methods have been proposed. However, since most of the methods segment the audio signal in a fixed time interval before indexing, the users cannot obtain the exact time of the audio-scene cuts. Therefore, we propose an accurate audio-scene cut detection method. We utilize the fuzzy c-means algorithm so that the reliability of the audio-shot cut is represented by the fuzzy number. Afterwards, the semantially correlated audio-shots are merged into the same audio-scene, and thereby the audio-scene cuts are obtained., IEEE, 英語
  • Audio-cut detection and audio-segment classification using fuzzy c-means clustering
    N Nitanda, M Haseyama, H Kitajima, 2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL IV, PROCEEDINGS, 4, 325, 328, 2004年
    This paper proposes an audio-cut detection and audio-segment classification method using fuzzy c-means clustering. In the proposed method, the boundaries between two different audio signals, which are called audio-cuts, can be detected by the fuzzy c-means clustering. In the fuzzy c-means clustering, the fuzzy number represents the possibility that the audio-cut exists. Therefore, according to the possibility, qualified candidates for audio-cuts can be obtained even if audio effects such as fade-in, fade-out, etc. are included in the audio signal. The audio signal is segmented at the detected audio-cuts, and these segments are classified into the following five classes: silence, music, speech, speech with music background, and speech with noise background. This classification simultaneously deletes the wrongly detected audio-cuts. Consequently, we can obtain the accurate audio-cuts and the classification results., IEEE, 英語
  • A GA-based realization method of optimal finite-precision system
    M Haseyama, D Matsuura, 2004 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL II, PROCEEDINGS, 2, 413, 416, 2004年
    A GA-based realization method of the optimal finite-prccision system is proposed. The optimal realizations of the finite-precision systems are defined as those that minimize the error between the frequency characteristics of the original infinite-precision system and its finite-precision represented one and can be shown as the solutions of a nonlinear programming problem. Therefore, in this paper, GA-based optimization strategy is presented to provide an efficient method for solving this problem. The proposed realization method of the optimal finite-precision system is based on not only the GA but also an SA to prevent the GA from going into local minima. Some numerical examples and comparison simulations with the traditional quantization methods, such as rounding off, rounding up, and rounding down, and another SA-based method are given to verify the high performance of the proposed method., IEEE, 英語
  • A novel image recognition method based on feature-extraction vector scheme
    M Hiramoto, T Ogawa, M Haseyama, ICIP: 2004 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1- 5, 2, 3049, 3052, 2004年
    This paper introduces a method for recognizing images using a new approach to expressing images as vectors. Using this expression method, an image is constructed from 2 types of vectors - vectors indicating positions and vectors denoting intensity gradients for those positions. When investigating the amount of difference between two images, similarities are evaluated by calculating voting densities in the image space, using the vectors making up the sample image in relation to the vectors expressing the reference image. The expression proposed is invariant to image rotation and by changing the resolution hierarchically, recognition using this expression is also adaptable to perspective and detail. Using this method, we carried out experimentation recognizing representative images from various fields and the results show that the method is effective in discriminating between them., IEEE, 英語
  • A convergence analysis technique for a cordic-based ARMA lattice filter
    S Shiraishi, M Haseyama, H Kitajima, TENCON 2004 - 2004 IEEE REGION 10 CONFERENCE, VOLS A-D, PROCEEDINGS, A, A487, A490, 2004年
    This paper presents an analysis technique for an adaptive ARMA lattice filter based on the CORDIC algorithm. The proposed technique brings a theoretical convergence analysis, which facilitates an efficient ASIC design of the ARMA lattice filter Although the proposed technique is dedicated to filters using a special arithmetic unit (CORDIC processor), we can apply it to popular multiplier-based fillers through slight modifications. Consequently, we can utilize the proposed technique for many applications in the signal processing., IEEE, 英語
  • A soccer field tracking method with wire frame model from TV images
    T Watanabe, M Haseyama, H Kitajima, ICIP: 2004 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1- 5, 3, 1633, 1636, 2004年
    This paper proposes a tracking method of soccer field area in a soccer video captured from TV. The camera taking the soccer game video is controlled by three parameters: its mount position, the angle, and the magnification. In order to estimate these three parameters, the proposed method designs a wire frame model, which represents the official layout of the soccer field lines; and by the wire frame model matching with the field area in the video, the above three parameters can be estimated, even if the soccer video includes the camera panning, zooming, etc. By using the estimated parameters. We call accurately obtain where the field area corresponds in the actual soccer field. Some experiments in tracking the field area in actual soccer videos are performed and their results verify the high performance of the proposed method., IEEE, 英語
  • An efficient phase retrieval method using snakes for image reconstruction
    K Kondo, M Haseyama, H Kitajima, ICIP: 2004 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOLS 1- 5, 4, 2427, 2430, 2004年
    This paper proposes a novel phase retrieval method using active contour models (snakes) for image reconstruction. The proposed method reconstructs a target image from the magnitude of fits Fourier transform and the measured area of the image. In general, the measured area is different from the true area where the target image exists. Thus the snake with an area term, which can extract the shape of the concave target image, is utilized to renew the measured area. By processing this renewal iteratively, the area obtained by the snake converges to the true area and as a result the proposed method can accurately reconstruct a target image even when the measured area is different from the true area. Experimental results show the effectiveness of the proposed method. This method has many applications Such as biomedical imaging using X-ray or optical detectors which have lost the phase information., IEEE, 英語
  • 配電系統事故復旧問題の遺伝的アルゴリズムを用いた多目的最適化に基づく解法
    稲垣 潤, 中島 純, 長谷山 美紀, 北島 秀夫, 電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society, 124, 3, 404, 412, 2004年
    Service restoration problem in distribution systems is formulated as a multi-objective optimization problem which is demanded not only for minimizing the amount of unrestored total loads but also for minimizing the number of the switching operations. The solution of the multi-objective optimization problem is usually obtained with a set of Pareto optimal solutions. The Pareto optimal solutions for the service restoration problem are useful for users to obtain their desired restoration by comparing a Pareto optimal solution with the others. However, the conventional methods cannot obtain plural Pareto optimal solutions in one trial. Therefore, this paper proposes a method for obtaining a Pareto optimal set for the service restoration problem with a genetic algorithm. The genetic algorithm produces many possible solutions in its search process. By utilizing this feature, the proposed method can obtain the Pareto optimal set., The Institute of Electrical Engineers of Japan, 英語
  • 高精度なフラクタル画像符号化のための評価関数とそのGAによる最適化
    竹沢 恵, 長谷山 美紀, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 58, 7, 937, 943, 2004年
    In fractal image coding, optimal contractive mapping should be determined to minimize the difference between the original image and a reconstruction of it. Though this can be determined by an exhaustive search, this approach is impractical because of its heavy calculation cost. Therefore, to reduce calculation cost, conventional methods determine an suitable contractive mapping by minimizing the difference between the original image and the collage. However, the obtained mapping cannot necessarily reconstruct a high quality image and this does not minimize reconstruction errors. Hence, in order to always obtain high-quality reconstructed images, we propose a new fractal image coding to minimize the errors by using genetic algorithms., 一般社団法人映像情報メディア学会, 日本語
  • フラクタル画像符号化によるJPEG画像の高精度化手法
    竹沢 恵, 長谷山 美紀, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 58, 9, 1317, 1323, 2004年
    We proposed high accuracy JPEG coding by including fractal image coding. JPEG coding is a commonly used standard method of accurately compressing images. However, in its decoded images, quantization errors occur especially in the region of high frequencies, such as object edges. Our method solved this problem by adding the obtained codes by fractal image coding to improve image quality in high frequency regions. Thus, our method achieved higher coding-performance than the traditional JPEG coding., 一般社団法人映像情報メディア学会, 日本語
  • PARCOR係数を用いたオーディオカット検出法 (適応信号処理特集号)
    二反田 直己, 白石 真一, 長谷山 美紀, 信号処理, 7, 6, 453, 460, 2003年11月
    〔信号処理学会〕, 日本語
  • 複数モデルに基づく適応的動き推定のためのVLSIアーキテクチャ (適応信号処理特集号)
    白石 真一, 仲川 和志, 長谷山 美紀, 信号処理, 7, 6, 461, 470, 2003年11月
    〔信号処理学会〕, 日本語
  • Image authentication based on fractal image coding without contamination of original image
    Miki Haseyama, Isao Kondo, Systems and Computers in Japan, 34, 9, 1, 9, 2003年08月
    Several digital watermarking methods proposed for the purpose of copyright protection embed signature data or images in the original images. Thus, they unavoidably produce degradation of the original images. Authors who create art works, however, desire to distribute their own originals unaltered. Therefore, this paper proposes a system for authentication of original images distributed without embedding any watermarks. The proposed method is based on fractal image coding, an image coding method. The IFS parameters obtained in fractal image coding are utilized as authentication parameters, and signature images for authentication are extracted using these parameters. © 2003 Wiley Periodicals, Inc., 英語
  • PARCOR 係数に着眼したファジィ c-means 法によるオーディオカット検出
    二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 38, 1, 4, 2003年07月17日
    映像情報メディア学会, 日本語
  • 高精度なランダム値インパルス性雑音除去のための一考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 38, 5, 8, 2003年07月17日
    映像情報メディア学会, 日本語
  • ビデオ顕微鏡像における細胞の自動抽出に関する一考察
    笹村 ゆかり, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 38, 21, 24, 2003年07月17日
    映像情報メディア学会, 日本語
  • 近傍画素の相関に着眼した失われた輝度値の復元に関する一考察
    小川 貴弘, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 38, 25, 28, 2003年07月17日
    映像情報メディア学会, 日本語
  • A line drawing simplification method which retains shape by using the fractal dimension
    Satoshi Uemura, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 34, 5, 1, 13, 2003年05月
    This paper presents a novel method for simplification of line drawings which can retain the shape of a given object. By noting that natural shapes innately possess the property designated self-similarity, the fractal dimension, one of the characteristics of fractal objects and a measure of complexity, is used as an index. With this index the degree of simplification can be quantified. In order to represent the approximation of a given object, the feature points are extracted by our analysis, whose basic idea was derived from Vector Tracer. Experimental results show the efficiency of our proposed method. © 2003 Wiley Periodicals, Inc., 英語
  • インパルス性雑音除去のための高精度な雑音検出法
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 86, 5, 654, 667, 2003年05月01日
    本論文では,インパルス性雑音によって劣化した画像の復元を目的とした高精度な雑音検出法を提案する。雑音検出と雑音除去の二つの処理によって画像復元を行う手法において,雑音除去は雑音検出の結果を用いて行われることから,復元結果の精度を向上させるためには,雑音の検出精度の向上か必須である。提案手法は,次の二つの処理により,高精度な雑音検出を実現する。(i)新たなフラグ画像(エッジノイズ画像)を導入し,それに基づいて処理点ごとに窓の大きさが異なるメジアンフィルタを選択し,雑音検出を行う。処理点ごとに適した大きさの窓のメジアンフィルタを用いることにより,精度良く雑音の位置を検出できる。(ii)(i)により得られた雑音検出結果に対して,インパルス性雑音か否かを検証する。この検証処理により,雑音検出結果の信頼性が高まり,(i)で得られた雑音検出の精度が更に向上する。提案手法は雑音の割合が高い場合にも適用が可能であり,本論文の最後では,実際の画像を用いた実験結果によりその有効性を示す。, 一般社団法人電子情報通信学会, 日本語
  • D-11-51 A Simple Performance Measure for Interframe Predictors for Video Coding
    Kitajima Hideo, Haseyama Miki, 電子情報通信学会総合大会講演論文集, 2003, 2, 51, 51, 2003年03月03日
    一般社団法人電子情報通信学会, 英語
  • Dynamic Coalescence Model を知識とした高次ニューラルネットの一般化
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション, 102, 689, 7, 10, 2003年02月27日
    筆者らはクラスタリング手法Dynamic Coalescence Model(DCM)をフィルタリングの観点から理論的に考察し[1],[3],DCMを知識とする学習識別系高次ニューラルネットワーク(HONN)を提案した.[2],[3]それらはいずれも,原点を通る線形面で特徴空間両点分布を識別していた.本論文では,学習パターンがわずかしか与えられない場合も含めた認識率改善手法を伴う線形識別面を自由探索するHONNを提案し,その有効性を実験的に考察する., 一般社団法人電子情報通信学会, 日本語
  • Dynamic Coalescence Model を知識とした高次ニューラルネットの一般化
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾, 山中 順吉, 電子情報通信学会技術研究報告. TL, 思考と言語, 102, 687, 7, 10, 2003年02月27日
    筆者らはクラスタリング手法Dynamic Coalescence Model(DCM)をフィルタリングの観点から理論的に考察し[1], [3],DCMを知識とする学習識別系高次ニューラルネットワーク(HONN)を提案した。[2], [3]それらはいずれも,原点を通る線形面で特徴空間内点分布を識別していた。本論文では,学習パターンがわずかしか与えられない場合も含めた認識率改善手法を伴う線形識別面を自由探索するHONNを提案し,その有効性を実験的に考察する。, 一般社団法人電子情報通信学会, 日本語
  • ファジィc-means法を用いたオーディオシーンカット検出に関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 8, 121, 126, 2003年02月03日
    動画像の分割を目的として,オーディオ信号の内容が変化する時刻(オーディオシーンカット)を検出する手法が提案されている.しかし,従来手法はオーディオ信号を予め定められた時間間隔で分割した後に得られたセグメントを音声や音楽等のクラスに分類し,隣接するセグメントのクラスを比較することでオーディオシーンカットを得るため,オーディオシーンカットが発生する正確な時刻を検出することは困難であった.そこで本稿では,オーディオシーンカットが発生する時刻を高精度に検出するために,ファジィc-means法を用いた新たな手法を提案する.提案手法はMPEG Audioで符号化されたオーディオ信号からオーディオシーンカットを検出することが可能であるため,MPEGで符号化された動画像分割への通用が期待できる., 一般社団法人映像情報メディア学会, 日本語
  • エッジ特徴を用いたWatershedアルゴリズムの改善とその髪型抽出への応用
    趙 延軍, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 8, 155, 160, 2003年02月03日
    領域分割を行う手法の一つとして,Watershedアルゴリズムがある.この手法は,マークと呼ばれる領域の中心を隣接画素へと広げていくことによって領域を得るため,領域間における境界線の密閉性と連続性を保証することができる.しかしながら,領域の未分割や過剰分割を生じるという問題がある.そこで,本稿ではエッジ特徴を利用し,Watershedアルゴリズムのマーク設定の改善を行うとともに,領域間の輝度値差分に着目した領域合併を行うことにより,上記問題を解決する手法を提案する.実験では,本提案手法の有効性の検証として,人物正面画像を用いて髪型の抽出を行う., 一般社団法人映像情報メディア学会, 日本語
  • テクスチャ認識のための多重スケール解析を用いた特徴量に関する考察
    石田 智也, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 9, 77, 82, 2003年02月03日
    テクスチャ要素に着目した従来のテクスチャ解析では,エッジや線要素に基づいてテクスチャ要素を定義しているため,ボケあるいはノイズによってテクスチャ画像が劣化した場合に,誤った解析結果を得ることがある.そこで,本文では,多重スケール解析に基づいて算出される特徴量を用いたテクスチャ解析手法を提案する.提案手法では,テクスチャ画像に対してガウスフィルタを施すことにより得られる,画像の濃淡曲面の凹凸部をテクスチャ要素と定義する.対象となるテクスチャ画像にノイズが含まれる場合においても,上のフィルタリングにより平滑化されるため,ノイズがテクスチャ要素に与える影響を軽減できる.したがって,このテクスチャ要素から算出された特徴量を用いることにより,ボケあるいはノイズに頑健なテクスチャ解析が実現できる., 一般社団法人映像情報メディア学会, 日本語
  • EFIFを用いた自己アフィンフラクタル図形の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 9, 95, 100, 2003年02月03日
    本文では, Extended Fractal Interpolation Functions(EFIF)を用いた自己アフィンフラクタル形状の拡大手法を提案する.EFIFを用いて与えられた形状を表現する際には,inverse problemと呼ばれる問題を解くことによって,その形状を特徴づけるために必要なパラメータを獲得しなければならない.しかしながら,拡大処理後の形状は,捕間されるべき未知のデータ点を含むため,そのinverse problemを解き,必要なパラメータを獲得することは困難である.そこで,本文では,与えられた形状を特徴づけるパラメータを用いて,拡大処理後の形状を表現するために必要なパラメータを決定できることを論理的に導く.提案手法では,この性質を用いることで,与えられた自己アフィンフラクタル形状に対する任意の倍率での拡大処理を実現する., 一般社団法人映像情報メディア学会, 日本語
  • 固定値及びランダム値インパルス性雑音除去のための雑音検出手法に関する一考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 9, 101, 106, 2003年02月03日
    インパルス性雑音によって劣化した画像の復元を目的として,高精度な雑音検出手法を提案する.従来の雑音検出手法では,固定値インパルス性雑音の検出性能は優れているものの,ランダム値インパルス性雑音においては充分ではない.そこで,本文では,固定値インパルス性雑音だけでなく,ランダム値インパルス性雑音においても,精度良くその位置を検出することを可能とするために,次の2つの処理により雑音検出を行う手法を提案する.(i)処理点の画素値とメディアン値の差における指標に基づいて雑音検出を行う.(ii)(i)により得られた雑音検出結果に対して,雑音か否かを検証する.これにより,固定値及びランダム値インパルス性雑音において,高精度な雑音検出を実現することが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • 線画像検索システムにおける計算量削減に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 9, 107, 112, 2003年02月03日
    本稿では,2分木を使用し,少ない計算量で類似した線画像を検索する手法を提案する.提案手法では,全ての対象画像がいずれかの葉に属する2分木を使用する.所望の画像を検索する際には,ユーザが入力した画像をもとに2分木をたどり,到達した葉が保持する各画像との間の類似度を算出する.さらに提案手法では,強化学習,および強化学習に基づいた再クラスタリングを適用する.強化学習は,入力画像とデータベース内の各画像との類似度をもとに,所望の画像の特徴を表現する特徴量について重み付けを行い,得られた重みに従って再度クラスタリングを行う.この2つの処理によって,ユーザの主観を反映したクラスタリングが実現される.提案手法によって,所望の画像を得るために必要とされる類似度算出の回数が減少し,計算量が削減される.また,実験により提案手法の有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • フラクタル画像符号化における高精度IFSパラメータの決定 : 探索時間の削減に関する考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 27, 9, 149, 154, 2003年02月03日
    フラクタル画像符号化において,原画像との誤差が最小となる再生画像を生成する最適なIFSパラメータを決定することは,多大な計算量を要することから困難とされている.よって,多くの手法では,原画像と再生画像との誤差ではなく,原画像とコラージュとの誤差を最小化することによって,比較的良好なIFSパラメータを短時間で決定している.しかしながら,このようにして決定されるIFSパラメータが最適なIFSパラメータであるとは限らず,必ずしも高品質な再生画像が得られない.そこで,この間題を解決するために,本来評価すべき再生画像と原画像との誤差を,遺伝的アルゴリズムと焼きなまし法を用いて最小化し,最適なIFSパラメータを決定する新たな手法が提案されている.本文では,この手法の処理時間の短縮を目指し,より短い時間で最適なIFSパラメータを決定する手法を提案する., 一般社団法人映像情報メディア学会, 日本語
  • 効果的な雑音除去のための適応的な画像のモデル化によるカルマンフィルタ
    松村 淳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 86, 2, 212, 222, 2003年02月01日
    本論文では,カルマンフィルタによる効果的な雑音除去を実現するための画像のモデル化法を提案する.カルマンフィルタにより画像を処理する際,原画像は注目画素とその隣接画素との相関を考慮して,自己回帰(autoregressive : AR)モデルで記述される.一般に,画像の種類やその画像内の平たん部やエッジ部によって,注目画素とその隣接画素間の相関は大きく異なることから,カルマンフィルタによる効果的な雑音除去のためには,処理対象画像,更にはその画像内の各部分に適応したモデル化が必要とされる.提案手法では,劣化状態にある処理対象画像から平たん部及びエッジ部を記述するモデルを高精度に推定することにより,画像の性質及び劣化状態を考慮したモデル化を実現する.画像内の各部分に適応したモデル化が実現されることにより,そのモデルから設計されるカルマンフィルタは,エッジ保存及び効果的なノイズの平滑化が可能となる.本論文の最後では,提案手法の有効性を示すために実験を行い,エッジ保存及びノイズの低減効果を確認している., 一般社団法人電子情報通信学会, 日本語
  • テクスチャ認識のための多重スケール解析を用いた特徴量に関する考察
    石田 智也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 630, 77, 82, 2003年01月28日
    テクスチャ要素に着目した従来のテクスチャ解析では,エッジや線要素に基づいてテクスチャ要素を定義しているため,ボケあるいはノイズによってテクスチャ画像が劣化した場合に,誤った解析結果を得ることがある.そこで,本文では,多重スケール解析に基づいて算出される特徴量を用いたテクスチャ解析手法を提案する.提案手法では,テクスチャ画像に対してガウスフィルタを施すことにより得られる,画像の濃淡曲面の凹凸部をテクスチャ要素と定義する.対象となるテクスチャ画像にノイズが含まれる場合においても,上のフィルタリングにより平滑化されるため,ノイズがテクステャ要素に与える影響を軽滅できる.したがって,このテクスチャ要素から算出された特徴量を用いることにより,ボケあるいはノイズに頑健なテクス千ャ解析が実現できる., 一般社団法人電子情報通信学会, 日本語
  • EFIFを用いた自己アフィンフラクタル図形の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 630, 95, 100, 2003年01月28日
    本文では,Extended Fractal Interpolation Functions(EFIF)を用いた自己にアフィンフラクタル形状の拡大手法を提案する.EFIFを用いて与えられた形状を表現する際には,inverse problemと呼ばれる問題を解くことによって,その形状を特徴づけるために必要なパラメータを獲得しなければならない.しかしながら,拡大処理後の形状は,補間されるべき未知のデータ点を含むため,そのinverse problemを解き,必要なパラメータを獲得することは困難である.そこで,本文では,与えられた形状を特徴づけるパラメータを用いて,拡大処理後の形状を表現するために必要なパラメータを決定できることを論理的に導く.提案方法では,この性質を用いることで,与えられた自己アフィンフラクタル形状に対する任意の倍率での拡大処理を実現する., 一般社団法人電子情報通信学会, 日本語
  • 固定値及びランダム値インパルス性雑音除去のための雑音検出手法に関する一考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 630, 101, 106, 2003年01月28日
    インパルス性雑音によって劣化した画像の復元を目的として,高精度な雑音検出手法を提案する.従来の雑音検出手法では,固定値インパルス性雑音の検出性能は優れているものの,ランダム値インパルス性雑音においては充分ではない.そこで,本文では,固定値インパルス性雑音だけでなく,ランダム値インパルス性雑音においても,精度良くその位置を検出することを可能とするために,次の2つの処理により雑音検出を行う手法を提案する.(i)処理点の画素値とメディアン値の差における指標に基づいて雑音検出を行う.(ii)(i)により得られた雑音検出結果に対して,雑音か否かを検証する.これにより,固定値及びランダム値インパルス性雑音において,高精度な雑音検出を実現することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 線画像検索システムにおける計算量削減に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 630, 107, 112, 2003年01月28日
    本稿では,2分木を使用し,少ない計算量て類似した線画象を検索する手法を提案する.提案手法では,全ての対象画像がいずれかの葉に属する2分木を使用する.所望の画像を検索する際には,ユーザが入力した画像をもとに2分木をたどり,到達した葉が保持する各画像との間の類似度を算出する.さらに提案手法では,強化学習,および強化学習に基づいた再クラスタリングを適用する.強化学習は,入力画像とデータベース内の各画像との類似度をもとに所望の画像の特徴を表現する特徴量について重み付けを行い,得られた重みに従って再度クラスタリングを行う.この2つの処理によって,ユーザの主観を反映したクラスタリングが実現される.提案手法によって,所望の画像を得るために必要とされる類似度算出の回数が減少し,計算量が削減される.また,実験により提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 英語
  • フラクタル画像符号化における高精度IFSパラメータの決定 : 探索時間の削減に関する考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 630, 149, 154, 2003年01月28日
    フラクタル画像符号化において,原画像との誤差が最小となる再生画像を生成する最適なIFSパラメータを決定することは,多大な計算量を要することから困難とされている.よって,多くの手法では,原画像と再生画像との誤差ではなく,原画像とコラージュとの誤差を最小化することによって,比較的良好なIFSパラメータを短時間で決定している.しかしながら,このようにして決定されるIFSパラメータが最適なIFSパラメータであるとは限らず,必ずしも高品質な再生画像が得られない.そこで,この問題を解決するために,本来評価すべき再生画像と原画像との誤差を,遺伝的アルゴリズムと焼きなまし法を用いて最小化し,最適なIFSパラメータを決定する新たな手法が提案されている.本文では,この手法の処理時間の短縮を目指し,より短い時間で最適なIFSパラメータを決定する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • テクスチャ認識のための多重スケール解析を用いた特徴量に関する考察
    石田 智也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 632, 77, 82, 2003年01月28日
    テクスチャ要素に着目した従末のテクスチャ解析では,エッジや線要素に基づいてテクスチャ要素を定義しているため,ボケあるいはノイズによってテクスチャ画像が劣化した場合に,誤った解析結果を得ることがある,そこで,本文では,多重スケール解析に基づいて算出される特徴量を用いたテクスチャ解析手法を提案する.提案手法では,テクスチャ画像に対してガウスフィルタを捨すことにより得られる,画像の濃淡曲面の凹凸部をテクスチャ要素と定義する.対象となるテクスチャ画像にノイズが含まれる場合においても,上のフィルタリングにより平滑化されるため,ノイズがテクスチャ要素に与える影響を軽減できる.したがって,このテクスチャ要素から算出された特徴量を用いることにより,ボケあるいはノイズに頑健なテクスチャ解析が実現できる., 一般社団法人電子情報通信学会, 日本語
  • EFIFを用いた自己アフィンフラクタル図形の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 632, 95, 100, 2003年01月28日
    本文では,Extended Fractal Interpolation Functions (EFIF)を用いた自己アフィンフラクタル形状の拡大手法を提案する.EFIFを用いて与えられた形状を表現する際にはinverse problemと呼ばれる問題を解くことによって,その形状を特徴づけるために必要なパラメータを獲得しなければならない.しかしながら,拡大処理後の形状は,補間されるべき未知のデータ点を含むため,そのinverse prblemを解き,必要なパラメータを獲得することは困難である.そこで,本文では,与えられた形状を特徴づけるパラメータを用いて拡大処理後の形状を表現するために必要なパラメータを決定できることを論理的に導く.提案手法では,この性質を用いることで,与えられ自己アフィンフラクタル形状に対する任意の倍率での拡大処理を実現する., 一般社団法人電子情報通信学会, 日本語
  • 固定値及びランダム値インパルス性雑音除去のための雑音検出手法に関する一考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 632, 101, 106, 2003年01月28日
    インパルス性雑音によって劣化した画像の復元を目的として,高精度な雑音検出手法を提案する.従来の雑音検出手法では,固定値インパルス性雑音の検出性能は優れているものの,ランダム値インパルス性雑音においては充分ではない.そこで,本文では,固定値インパルス性雑音だけでなく,ランダム値インパルス性雑音においても,精度良くその位置を検出することを可能とするために,次の2つの処理により雑音検出を行う手法を提案する.(i)処理点の画素値とメディアン値の差における指標に基づいて雑音検出を行う.(ii)(i)により得られた雑音検出結果に対して,雑音か否かを検証する.これにより,固定値及びランダム値インパルス性雑音において,高精度な雑音検出を実現することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 線画像検索システムにおける計算量削減に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 632, 107, 112, 2003年01月28日
    本稿では,2分木を使用し少ない計算量で類似した線画像を検索する手法を提案する.提案手法では,全ての対象画像がいずれかの葉に属する2分木を使用する.所望の画像を検索する際には,ユーザが入力した画像をもとに2分木をたどり,到達した葉が保待する各画像との間の類似度を算出する.さらに提案手法では,強化学習,および強化学習に基づいた再クラスタリングを適用する,強化学習は,入力画像とデータベース内の各画像との類似度をもとに,所望の画像の特徴を表現する特徴量について重み付けを行い,得られた重みに従って再度クラスタリングを行う.この2つの処理によって,ユーザの主観を反映したクラスタリングが実現される.提案手法によって,所望の画像を得るために必要とされる類例、度算出の回数が減少し,計算量が削減される.また,実験により提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 英語
  • フラクタル画像符号化における高精度IFSパラメータの決定 : 探索時間の削減に関する考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 632, 149, 154, 2003年01月28日
    フラクタル画像符号化において,原画像との誤差が最小となる再生画像を生成する最適なIFSパラメータを決定することは,多大な計算量を要することから困難とされている.よって,多くの手法では,原画像と再生画像との誤差ではなく,原画像とコラージュとの誤差を最小化することによって,比較的良好なIFSパラメータを短時間で決定している.しかしながら,このようにして決定されるIFSパラメータが最適なIFSパラメータであるとは限らず,必ずしも高品質な再生画像が得られない.そこで,この問題を解決するために,本来評価すべき再生画像と原画像との誤差を,遺伝的アルゴリズムと焼きなまし法を用いて最小化し,最適なIFSパラメータを決定する新たな手法が提案されている.本文では,この手法の処理時間の短縮を目指し,より短い時間で最適なIFSパラメータを決定する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • ファジィ c-means 法を用いたオーディオシーンカット検出に関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 629, 121, 126, 2003年01月27日
    動画像の分割を目的として,オーディオ信号の内容が変化する時刻(オーディオシーンカット)を検出する手法が提案されている.しかし,従来手法はオーディオ信号を予め定められた時間間隔て分割した後に得られたセグメントを音声や音楽等のクラスに分類し,隣接するセグメントのクラスを比較することでオーディオシーンカットを得るため,オーディオシーンカットが発生する正確な時刻を検出することは困難であった.そこで本稿では,オーディオシーンカットが発生する時刻を高精度に検出するために,ファジィc-means法を用いた新たな手法を提案する.提案手法はMPEG Audioで符号化されたオーディオ信号からオーディオシーンカットを検出することが可能であるため,MPEGで符号化された動画像分割への適用が期待できる., 一般社団法人電子情報通信学会, 日本語
  • エッジ特徴を用いた Watershed アルゴリズムの改善とその髪型抽出への応用
    趙 延軍, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 102, 629, 155, 160, 2003年01月27日
    領域分割を行う手法の一つとして,Watershedアルゴリズムがある.この手法は,マークと呼ばれる領域の中心を隣接画素へと広げていくことによって領域を得るため,領域間における境界線の密閉性と連続性を保証することができる.しかしながら,領域の未分割や過剰分割を生じるという問題がある.そこで,本稿ではエッジ特徴を利用し,Watershedアルゴリズムのマーク設定の改善を行うとともに,領域間の輝度値差分に着目した領域合併を行うことにより,上記問題を解決する手法を提案する.実験では,本提案手法の有効性の検証として,人物正面画像を用いて髪型の抽出を行う., 一般社団法人電子情報通信学会, 日本語
  • ファジィ c-means 法を用いたオーディオシーンカット検出に関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 631, 121, 126, 2003年01月27日
    動画像の分割を目的として,オ一ディオ信号の内容が変化する時刻(オーディオシーンカット)を検出する手法が提案されている.しかし,従来手法はオーディオ信号を予め定められた時間間隔で分割した後に得られたセグメントを冷声や音楽等のクラスに分類し,隣接するセグメントのクラスを比較することでオーディオシーンカットを得るため,オ一ディオシーンカットが発生する正確な時刻を検出することは困難であった.そこで本橋では,オーディオシーンカットが発生する時刻を高粘度に検出するために,ファジィc-means法を用いた新たな手法を提案する.提案手法はMPEG Audioで符号化されたオーディオ信号からオーディオシーンカットを検出することが可能であるため,MPEGで符号化された動画像分割への適用が期待できる., 一般社団法人電子情報通信学会, 日本語
  • エッジ特徴を用いた Watershed アルゴリズムの改善とその髪型抽出への応用
    趙 延軍, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 631, 155, 160, 2003年01月27日
    領域分割を行う手法の一つとして,Watershodアルゴリズムがある.この手法は,マークと呼ばれる領域の中心を隣接画素へと広げていくことによって領域を得るため,領域間における境界線の密閉性と連続性を保証することができる.しかしながら,領域の右分割や過剰分割を生じるという問題がある.そこで,本稿ではエッジ特徴を利用し,Watershedアルゴリズムのマーク設定の改善を行うとともに,領域間の輝度値差分に着目した領域合併を行うことにより,上記問題を解決する手法を提案する.実験では,本提案手法の有効性の検証として,人物正面対象を用いて髪型の抽出を行う., 一般社団法人電子情報通信学会, 日本語
  • A SHAPE-CONSTRAINT-BASED SPLITTING ACTIVE CONTOUR MODEL AND ITS APPLICATIONS
    Yoneyama Shogo, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 571, 83, 86, 2003年01月15日
    This paper presents a new splitting active contour model which can extract the shapes of multiple objects included in one initial contour individually. Most of the approaches based on active contour models (Snakes) cannot extract the shapes of multiple objects, since they require that one initial contour includes one object. To overcome this problem, the proposed method utilizes a splitting mechanism which works according to two types of Snake energy functions. Based on the difference in the extraction results obtained by minimizing their energy functions, an initial contour is split into multiple contours. After iterative splitting, each contour can include one object. Therefore, our splitting Snake can extract the desired object even if other objects are included within the same initial contour together. For evaluating its extraction performance, we apply our splitting Snake to extracting facial features from an image sequence taken from TV news program. The extraction results show the effectiveness of the proposed method., 一般社団法人電子情報通信学会, 英語
  • AN ACCURATE NOISE DETECTOR FOR THE REMOVAL OF IMPULSIVE NOISE
    Kondo Keiko, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 571, 21, 24, 2003年01月15日
    This paper proposes a new noise-detection method for the restoration of images corrupted by impulsive noise. The proposed method consists of two systems. In the first system, we generate a new flag image to classify the pixels of an observed image into two types: the pixels in flat areas and edge areas, and then different noise detectors process each type of pixels classified according to the flag image. The second system verifies the pixels once detected as impulsive noise by the first system. The combination of these two systems can accurately detect the location of impulsive noise and be effectively used as a preprocessor for a noise reduction filter. Experiments show that the proposed method can accurately detect the location of impulsive noise even if the observed images are highly corrupted., 一般社団法人電子情報通信学会, 英語
  • A GA AND SA-BASED FAST SEARCH ALGORITHM FOR IFS PARAMETERS IN FRACTAL IMAGE CODING
    Takezawa Megumi, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 571, 25, 28, 2003年01月15日
    This paper proposes a fast search technique using a genetic algorithm (GA) and simulated annealing (SA) for the optimal parameters of the iterated function system (IPS) utilized in fractal image coding. Heavy computation cost for finding the optimal IPS parameters is conventionally a serious problem, and thus several techniques to reduce its computation cost have been reported. One of them utilizes the GA to find them in shorter time than the other techniques However, its reduction is not enough for the practical use. Therefore, the proposed method achieves further reduction by including an SA search in a GA search. By utilizing the advantages of both the GA and the SA, we can search for the optimal IPS parameters more effectively. Moreover, some simulation results show that the proposed method achieves more reduction in the computation cost than the only GA-based method does., 一般社団法人電子情報通信学会, 英語
  • A CONTENT-BASED IMAGE RETRIEVAL METHOD BASED ON FRACTAL IMAGE CODING
    Kondo Isao, Haseyama Miki, Kitajima Hideo, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 570, 89, 92, 2003年01月14日
    In this paper, we present a new content-based image retrieval method based on the fractal image coding. Several content-based image retrieval methods have been reported. However, most of them require high computation cost because they perform multiplication when computing the similarity between a query image and database images. There-fore, in order to achieve image retrieval with low computation cost, the proposed method introduces a new similarity measurement. Moreover, to effectively distinguish similar images to the query image from the others, the proposed method searches the database images for the similar images based on a novel approach which utilizes the advantage of the fractal image coding. The experimental results show that the proposed method can search for the similar images not only quickly but also accurately., 一般社団法人電子情報通信学会, 英語
  • サッカー映像における撮影フィールド領域の検出に関する一考察
    渡辺友樹, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • ブロックマッチングの高精度化 ブロックサイズが小さい場合の考察
    徳永佳晃, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • 有限語長ディジタルフィルタの設計に関する考察-周波数特性の劣化と丸め誤差の軽減-
    松浦大樹, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • GA及びSAを用いた対応点決定法の高精度化に関する一考察
    蛸島康平, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • 多重スケール解析を用いたテクスチャ画像の識別に関する考察
    石田智也, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • FIFを用いた音声信号のサンプリングレート変換に関する考察
    上村郷志, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • 映像インデキシングを目的としたMPEG Audioデータのクラスタリングに関する一考察
    二反田直己, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • リング周波数フィルタを用いた眉間検出の高精度化に関する一考察
    金子千晶, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • ビデオ顕微鏡におけるアポトーシス細胞の自動抽出に関する一考察
    笹村ゆかり, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • 上限値制約を伴う経路探索手法のGAによる実現
    稲垣潤, 長谷山美紀, 北島秀夫, 情報科学技術フォーラム, FIT 2003, 2003年
  • Restoration method of missing image data using modified optical flow
    T Ogawa, M Haseyama, H Kitajima, IEEE EMBS APBME 2003, 130, 131, 2003年
    This paper proposes a restoration method of still images including missing pixels by a modified optical flow, which is different from the traditional flow. For successful restoration, the proposed method introduces a new parameter into the selection scheme of the optimum optical flow, which can represent how much reliable the obtained flow is; and based on this parameter, highly reliable optical flows are mainly used in the image restoration. The proposed method consequently achieves more accurate restoration than the previous method does especially in the edge area., IEEE, 英語
  • Ultra low bit-rate image coding algorithm based on fractal image coding
    M Takezawa, M Haseyama, H Kitajima, ISPA 2003: PROCEEDINGS OF THE 3RD INTERNATIONAL SYMPOSIUM ON IMAGE AND SIGNAL PROCESSING AND ANALYSIS, PTS 1 AND 2, 2, 1013, 1017, 2003年
    This paper proposes a low bit-rate fractal image coding algorithm for wireless communication. The fractal image coding is well known for its high compression performance. This performance is useful for the future wireless communication with narrow-band. However, in order to become a powerful image coding technique for the wireless communication, its reconstructed image quality must be improved. Therefore, to achieve further quality improvement, a novel fractal image coding algorithm is proposed. Some simulation results verify that the proposed method can reconstruct the images with 1.4dB higher quality than JPEG at low bit-rates below 0.12bits pixel and also higher quality than JPEG2000 at very low bit-rates below 0.035-0.05bits pixel., UNIV ZAGREB, FACULTY MECHANICAL ENGINEERING & NAVAL ARCHITECTURE, 英語
  • Fast line extraction from digital images using line segments
    Euijin Kim, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 34, 10, 76, 89, 2003年
    This paper presents a fast line extraction method using the line segments found in digital images. A digital line can be decomposed into line segments, which consist of continuous edge pixels, in four directions. The directions of the line segments are varied and limited by the relationship between the line segments and the slopes of analog lines. The proposed method attains high speed and accuracy by tracking each line segment in the same direction which comes from the relationship. Experimental results are included to show that the proposed method can achieve high accuracy with a large reduction in the computation time and has robustness in the presence of noise., 英語
  • A trainable retrieval system for cartoon character images
    M Haseyama, A Matsumura, 2003 INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO, VOL II, PROCEEDINGS, 2, 393, 396, 2003年
    This paper proposes a novel method to retrieve cartoon character images in a database or network. In this method, partial features of an image, defined as Regions and Aspects, are used as keys to identify cartoon character images. The similarities between a query cartoon character image and the images in the database are computed by using these features. Based on the similarities, the cartoon images same or similar to the query image are identified and retrieved from the database. Moreover, our method adopts a training scheme to reflect the user's subjectivity. The training emphasizes the significant Regions or Aspects by assigning more weight based on the user's preferences and actions, such as selecting a desired image or an area of an image. These processes make the retrieval more effective and accurate. Experiment results verify the effectiveness and retrieval accuracy of the method., IEEE, 英語
  • 2-D functional AR Model for image identification
    M Haseyama, Kondo, I, 2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL III, PROCEEDINGS, 2, 605, 608, 2003年
    This paper proposes a 2-D Functional AR Model for image identification. The definition of the proposed model includes functions that can exploit the self-similarity nature in images to throughly extract image features. By introducing the functional scheme into the model, only a few number of parameters, which are called 2-D Functional AR parameters, can describe the image features simply and accurately. These characteristics make the model suitable for image identification applications. Some experiments of image identification are performed, and the results verify that the proposed model accurately represents the image feature, and the image can be correctly identified. The calculation time is fast enough for practical use in image retrieval., IEEE, 英語
  • An automatic extraction method for apoptotic cell from video microscopy images
    Y Sasamura, M Barboric, M Haseyama, IEEE EMBS APBME 2003, 210, 211, 2003年
    This paper presents an automatic extraction method for apoptotic cells from video microscopy images. Since the apoptosis, which is called cell death, is well-known to he related with various disease. Therefore, several researchers try to reveal its mechanism and often analyze the images acquired under the video microscopes. However, the performance of software used in the image analysis is not enough for the auto-detection of the apoptotic cells, and thus the researchers have to manually detect the apoptotic cells from the images. Therefore, this paper proposes a method to automatically detect the apoptotic cells based on their inherent shape features., IEEE, 英語
  • A GA-based routing method with an upper bound constraint
    J Inagaki, M Haseyama, H Kitajima, PROCEEDINGS OF THE 2003 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL II, 2, 488, 491, 2003年
    This paper presents a method of searching for the shortest route via the most designated points among the routes whose lengths are less than the upper bound and its effectiveness is verified by applying the algorithm to map data. The proposed algorithm uses a fitness function which includes weight parameters based on the building block hypothesis. By using this function, the optimum is efficiently obtained. This kind of routing is difficult in the case of using existing methods such as Dijkstra's method. Also, the proposed method is more useful., IEEE, 英語
  • Convergence analysis of a cordic-based gradient adaptive lattice filter
    S Shiraishi, M Haseyama, H Kitajima, PROCEEDINGS OF THE 2003 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL IV, 4, 456, 459, 2003年
    This paper presents a theoretical analysis of a CORDIC-based gradient adaptive lattice filter. First, we provide a convergence model and reveal convergence properties of filter coefficients. Second, we derive a steady-state model based on a Markov chain. By using the steady-state model, the relation between the step size parameter and the variance of the estimation error is clarified. The results of the analysis facilitate an efficient hardware design of the filter., IEEE, 英語
  • 2-D functional AR Model for image identification
    M Haseyama, Kondo, I, 2003 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL III, PROCEEDINGS, 3, 605, 608, 2003年
    This paper proposes a 2-D Functional AR Model for image identification. The definition of the proposed model includes functions that can exploit the self-similarity nature in images to throughly extract image features. By introducing the functional scheme into the model, only a few number of parameters, which are called 2-D Functional AR parameters, can describe the image features simply and accurately. These characteristics make the model suitable for image identification applications. Some experiments of image identification are performed, and the results verify that the proposed model accurately represents the image feature, and the image can be correctly identified. The calculation time is fast enough for practical use in image retrieval., IEEE, 英語
  • A trainable retrieval system for cartoon character images
    M Haseyama, A Matsumura, 2003 INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO, VOL II, PROCEEDINGS, 3, 393, 396, 2003年
    This paper proposes a novel method to retrieve cartoon character images in a database or network. In this method, partial features of an image, defined as Regions and Aspects, are used as keys to identify cartoon character images. The similarities between a query cartoon character image and the images in the database are computed by using these features. Based on the similarities, the cartoon images same or similar to the query image are identified and retrieved from the database. Moreover, our method adopts a training scheme to reflect the user's subjectivity. The training emphasizes the significant Regions or Aspects by assigning more weight based on the user's preferences and actions, such as selecting a desired image or an area of an image. These processes make the retrieval more effective and accurate. Experiment results verify the effectiveness and retrieval accuracy of the method., IEEE, 英語
  • A Kalman filter using texture for noise reduction in SAR images
    M Tsuchida, M Haseyama, H Kitajima, ELECTRONICS AND COMMUNICATIONS IN JAPAN PART I-COMMUNICATIONS, 86, 10, 21, 32, 2003年
    In this paper, we propose a noise reduction method for synthetic aperture radar (SAR) images that uses a Kalman filter. The noise in SAR images is primarily generated by speckle and appears as salt-and-pepper noise. Speckle noise is known to have the multiplicative statistical property, but this property may not hold depending on the region. Consequently, adequate noise removal is difficult. In radar, the expected values of the backscattered waves change due to the type of reflecting object. The proposed method segments an image into several regions based on the texture and varies the parameters in Kalman filtering in response to the region. By varying the parameters, the processing can account for the noise generated primarily by speckle in actual SAR images and the changes in the statistical properties of the backscattered. waves. In this paper, we apply the proposed method to synthetic test images and to actual SAR images to quantitatively evaluate the noise reduction and present the results. (C) 2003 Wiley Periodicals, Inc., SCRIPTA TECHNICA-JOHN WILEY & SONS, 英語
  • A cartoon character retrieval system including trainable scheme
    M Haseyama, A Matsumura, 2003 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOL 3, PROCEEDINGS, 3, 37, 40, 2003年
    This paper proposes a novel method to retrieve cartoon character images in a database or network. In this method, partial features of an cartoon image, defined as Regions and Aspects, are used as keys to identify cartoon characters. The similarities between a query cartoon character image and the images in the database are computed by using these features. Based on the similarities, the cartoon images same or similar to the query image are identified and retrieved from the database. Moreover, our method adopts a training scheme to reflect the user's subjectivity. The training emphasizes the significant Regions or Aspects based on the user's preferences and actions, such as selecting a desired image or an area of an image. These processes make the cartoon-character retrieval more effective and accurate. Experimental results verify the effectiveness and retrieval accuracy of the method., IEEE, 英語
  • 顔器官抽出のための形状に基づく分裂型輪郭モデル
    長谷山 美紀, 米山 昇吾, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 57, 6, 729, 735, 2003年
    The shape-constraint-based active contour model (SC-ACM), one of the Snakes, is robust against noise. However, an SC-ACM's extraction ability depends on initial contour locations so that it often fails to extract face features, because they are located too close to each other. Therefore, in order to resolve this problem, we use a splitting mechanism with the SC-ACM, whereby the proposed Snakes are split according to the difference between the results obtained by using the previous SC-ACM and other Snakes with an area term. The proposed Snakes with the splitting mechanism can extract every feature, even though the initial contour includes multiple objects. We simulated extracting face-features from TV news images of the upper part of an announcer maintaining a full face position. Our results show that the proposed method can extract each of the eyes with the brows and the mouth including its neighboring areas without getting trapped by other face features., 一般社団法人映像情報メディア学会, 日本語
  • GA および SA を用いたフラクタル画像符号化
    Takezawa Megumi, Haseyama Miki, Kitajima Hideo, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 57, 7, 864, 867, 2003年
    This paper proposes a fast search technique using a genetic algorithm (GA) including a simulated annealing (SA) algorithm for the optimal parameters of the iterated function system (IFS) utilized in fractal image coding. The heavy computational costs of the previous methods to find the optimal IFS parameters are a serious problem, and in order to overcome it, we have already proposed a GA-based technique to find them in short time. However, its reduction is not enough for the practical use. Therefore, the proposed method achieves further reduction by including an SA search in the GA search. Some simulation results show that the proposed method achieves more reduction in the computational costs than the only GA-based method does., 一般社団法人映像情報メディア学会, 日本語
  • ビデオ顕微鏡像における細胞抽出に関する考察
    笹村 ゆかり, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2002, 120, 63, 68, 2002年12月16日
    ビデオ顕微鏡より得られた動画像から,アポトーシス細胞のみを自動抽出する手法を提案する.遺伝子によって制御された細胞死であるアポトーシスは,様々な疾病の発症に深く関わっており,そのメカニズムの解明に関する研究が行われている.細胞の観察にはビデオ顕微鏡を用いているが,その解析方法は目視や簡易なソフトウェアに依存しているのが現状である.提案手法では,アポトーシス細胞の持つ形状的特徴に着眼し形状解析を行い,また、ビデオ顕微鏡像は時系列上連続した動画であることから各フレームの前後関係を考慮した処理を行うことによって,所望の細胞か否かを判定する.これにより,アポトーシス細胞のみを自動抽出することを可能とする.This paper presents an effective method which can automatically extract the apoptotic cells from image sequence obtained by using videomicroscopy. Since apoptosis, which called cell death is well-known to be related with various disease. Therefore, several researchers try to reveal its mechanism. Furture, for the purpose they often analyze images acquired in the videomicroscopy, by suing simple software or visual recognition. However, even using the software, they have to manually process or check the images, because its performance is not enough for the auto-detectionof the apototic cells, which are based on the inherent features of the images of the apototic cells., 一般社団法人情報処理学会, 日本語
  • GA及びゲーム理論を用いた看護師スケジューリングに関する一考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2002, 120, 81, 86, 2002年12月16日
    多目的最適化問題の一つである看護師スケジューリング問題(Nurse Scheduling Problem:NSP)の解法として,GA及びゲーム理論を用いた手法を提案する.NSPに対する従来の解法では,最適化の対象は数式モデルとして表現可能な目的に限定されていた.そこで,本文では,看護師をプレイヤーとした交渉ゲームを導入した勤務決定手法を提案する.これにより,プレイヤーの戦略を個別に定めることで,評価関数の設定が困難な目的の一つである看護師の個性の反映が可能となる.This paper presents a method using a genetic algorithm and game theory for Nurse Scheduling Problem(NSP), which is one of the multiobjective optimization problems. The object for the traditional approach of the NSP has to be definitely formulated by a performance function. The proposed method provides an optimization scheme for solving problems including objects like nurses' preferences, which cannot be formulated by any performance functions by utilizing a game where each player has its own strategy., 一般社団法人情報処理学会, 日本語
  • FIFを用いた一次元離散信号の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2002, 120, 87, 92, 2002年12月16日
    フラクタルモデルの1つであるFractal Interpolation Functions(FIF)を用いた一次元離散信号の拡大手法を提案する。FIFを用いて離散信号を表現する際には、対照となる信号ごとに設定されるinverse problemと呼ばれる問題を解くことによって、必要なパラメータを決定しなければならない。しかしながら、拡大処理後の信号は補間されるべき未知のデータ点を含むため、そのinverse problemを解くことは困難である。そこで、本文では、与えられた信号に関するinverse problemの解を用いることで拡大処理後の信号に関するinverse problemを容易に解くことが可能であることを示す。これにより、与えられた離散信号に対する任意の倍率での拡大処理を容易に実現することが可能となる。This paper presents a novel expansion technique for one-dimensional discrete signals derived by using Fractal Interpolation Functions(FIF) known as one of the fractal models. When FIF is applied to a given discrete signal, the map parameters, which are required to represent the signal in FIF, must be determined by solving the inverse problem set as depending on the signal. However, the inverse problem concerned with the expanded signal cannot be easily solved, since the expanded signal includes unknown data points which must be interpolated. Therefore we demonstrate that the inverse problem concerned with the expanded signal can be easily solved by using the map parameters obtained by solving the problem of the given signal and thereby a given signal can be efficiently expanded with an arbitrary rate., 一般社団法人情報処理学会, 日本語
  • ビデオ顕微鏡像における細胞抽出に関する考察
    笹村 ゆかり, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 82, 63, 68, 2002年12月12日
    ビデオ顕微鏡より得られた動画像から,アポトーシス細胞のみを自動抽出する手法を提案する.遺伝子によって制御された細胞死であるアポトーシスは,様々な疾病の発症に深く関わっており,そのメカニズムの解明に関する研究が行われている.細胞の観察にはビデオ顕微鏡を用いているが,その解析方法は目視や簡易なソフトウェアに依存しているのが現状である.提案手法では,アポトーシス細胞の持つ形状的特徴に着眼し形状解析を行い,また、ビデオ顕微鏡像は時系列上連続した動画であることから各フレームの前後関係を考慮した処理を行うことによって,所望の細胞か否かを判定する.これにより,アポトーシス細胞のみを自動抽出することを可能とする., 一般社団法人映像情報メディア学会, 日本語
  • GA及びゲーム理論を用いた看護師スケジューリングに関する一考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 82, 81, 86, 2002年12月12日
    多目的最適化問題の一つである看護師スケジューリング問題(Nurse Scheduling Problem:NSP)の解法として,GA及びゲーム理論を用いた手法を提案する.NSPに対する従来の解法では,最適化の対象は数式モデルとして表現可能な目的に限定されていた.そこで,本文では,看護師をプレイヤーとした交渉ゲームを導入した勤務決定手法を提案する.これにより,プレイヤーの戦略を個別に定めることで,評価関数の設定が困難な目的の一つである看護師の個性の反映が可能となる., 一般社団法人映像情報メディア学会, 日本語
  • FIF を用いた一次元離散信号の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 82, 87, 92, 2002年12月12日
    フラクタルモデルの1つであるFractal Interpolation Functions (FIF)を用いた一次元離散信号の拡大手法を提案する. FIFを用いて離散信号を表現する際には,対象となる信号ごとに設定されるinverse problemと呼ばれる問題を解くことによって,必要なパラメータを決定しなければならない.しかしながら,拡大処理後の信号は補間されるべき未知のデータ点を含むため,そのinverse problemを解くことは困難である.そこで,本文では,与えられた信号に関するinverse problemの解を用いることで,拡大処理後の信号に関するinverse problemを容易に解くことが可能であることを示す.これにより,与えられた離散信号に対する任意の倍率での拡大処理を容易に実現することが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • ビデオ顕微鏡像における細胞抽出に関する考察
    笹村 ゆかり, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 518, 63, 68, 2002年12月09日
    ビデオ顕微鏡より得られた動画像から,アポトーシス細胞のみを自動抽出する手法を提案する.遺伝子によって制御された細胞死であるアポトーシスは,様々な疾病の発症に深く関わっており,そのメカニズムの解明に関する研究が行われている.細胞の観察にはビデオ顕微鏡を用いているが,その解析方法は目視や簡易なソフトウェアに依存しているのが現状である.提案手法では,アポトーシス細胞の持つ形状的特徴に着眼し形状解析を行い,また、ビデオ顕微鏡像は時系列上連続した動画であることから各フレームの前後関係を考慮した処理を行うことによって,所望の細胞か否かを判定する.これにより,アポトーシス細胞のみを自動抽出することを可能とする., 一般社団法人電子情報通信学会, 日本語
  • GA及びゲーム理論を用いた看護師スケジューリングに関する一考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 518, 81, 86, 2002年12月09日
    多目的最適化問題の一つである看護師スケジューリング問題(Nurse Scheduling Problem:NSP)の解法として,GA及びゲーム理論を用いた手法を提案する.NSPに対する従来の解法では,最適化の対象は数式モデルとして表現可能な目的に限定されていた.そこで,本文では,看護師をプレイヤーとした交渉ゲームを導入した勤務決定手法を提案する.これにより,プレイヤーの戦略を個別に定めることで,評価関数の設定が困難な目的の一つである看護師の個性の反映が可能となる., 一般社団法人電子情報通信学会, 日本語
  • FIFを用いた一次元離散信号の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 518, 87, 92, 2002年12月09日
    フラクタルモデルの1つであるFractal Interpolation Functions (FIF)を用いた一次元離散信号の拡大手法を提案する.FIFを用いて離散信号を表現する際には,対象となる信号ごとに設定されるinverse problemと呼ばれる問題を解くことによって,必要なパラメータを決定しなければならない.しかしながら,拡大処理後の信号は補間されるべき未知のデータ点を含むため,そのinverse problemを解くことは困難である.そこで,本文では,与えられた信号に関するinverse problemの解を用いることで,拡大処理後の信号に関するinverse problemを容易に解くことが可能であることを示す.これにより,与えられた離散信号に対する任意の倍率での拡大処理を容易に実現することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • ビデオ顕微鏡像における細胞抽出に関する考察
    笹村 ゆかり, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 102, 516, 63, 68, 2002年12月09日
    ビデオ顕微鏡より得られた動画像から,アポトーシス細胞のみを自動抽出する手法を提案する.遺伝子によって制御された細胞死であるアポトーシスは,様々な疾病の発症に深く関わっており,そのメカニズムの解明に関する研究が行われている.細胞の観察にはビデオ顕微鏡を用いているが,その解析方法は目視や簡易なソフトウェアに依存しているのが現状である.提案手法では,アポトーシス細胞の持つ形状的特徴に着眼し形状解析を行い,また、ビデオ顕微鏡像は時系列上連続した動画であることから各フレームの前後関係を考慮した処理を行うことによって,所望の細胞か否かを判定する.これにより,アポトーシス細胞のみを自動抽出することを可能とする., 一般社団法人電子情報通信学会, 日本語
  • GA及びゲーム理論を用いた看護師スケジューリングに関する一考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 102, 516, 81, 86, 2002年12月09日
    多目的最適化問題の一つである看護師スケジューリング問題(Nurse Scheduling Problem:NSP)の解法として,GA及びゲーム理論を用いた手法を提案する.NSPに対する従来の解法では,最適化の対象は数式モデルとして表現可能な目的に限定されていた.そこで,本文では,看護師をプレイヤーとした交渉ゲームを導入した勤務決定手法を提案する.これにより,プレイヤーの戦略を個別に定めることで,評価関数の設定が困難な目的の一つである看護師の個性の反映が可能となる., 一般社団法人電子情報通信学会, 日本語
  • FIFを用いた一次元離散信号の拡大処理に関する考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 102, 516, 87, 92, 2002年12月09日
    フラクタルモデルの1つであるFractal Interpolation Functions(FIF)を用いた一次元離散信号の拡大手法を提案する.FIFを用いて離散信号を表現する際には,対象となる信号ごとに設定されるinverse problemと呼ばれる問題を解くことによって,必要なパラメータを決定しなければならない.しかしながら,拡大処理後の信号は補間されるべき未知のデータ点を含むため,そのinverse problemを解くことは困難である.そこで,本文では,与えられた信号に関するinverse problemの解を用いることで,拡大処理後の信号に関するinverse problemを容易に解くことが可能であることを示す.これにより,与えられた離散信号に対する任意の倍率での拡大処理を容易に実現することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • Fast and Robust Ellipse Extraction from Complicated Images
    Euijin Kim, Miki Haseyama, Hideo Kitajima, Proceedings of the First International Conference on Information Technology and Applications (ICITA 2002), 357, 362, 2002年12月01日
    In this paper, we present a fast and robust ellipse extraction method. The proposed method can extract ellipses with high accuracy and speed from images with complicated backgrounds. It consists of two parts. First, we extract arc segments from an ellipse approximated by short straight lines that are extracted by a fast line extraction algorithm. Second, the arc segments are used to calculate accurate ellipse parameters with a least squares ellipse fitting algorithm. Tests performed on synthetic and real-world images show that the method quickly and accurately extracts circles from complicated images.
  • Extraction of Circles from Arcs Segmented into Short Straight Lines
    Euijin Kim, Miki Haseyama, Hideo Kitajima, Proceedings of the First International Conference on Information Technology and Applications (ICITA 2002), 363, 368, 2002年12月01日
    This paper presents a new method that is capable of extracting circles from complicated and heavily corrupted images, which is not based on the Hough transform (HT). The proposed method consists of three parts. First, we approximately detect short straight lines from the image by using a fast line extraction algorithm. Second, it uses a least squares fitting algorithm for arc segments. The arc segments are used to calculate accurate circle parameters instead of using a parameter space. Finally, by using the segmented arcs we extract circles. Tests performed on synthetic and real-world images show that the algorithm quickly and accurately extracts circles from complicated and heavily corrupted images.
  • フラクタル画像符号化に着想を得た著作画像の劣化を伴わない著者認証法
    長谷山 美紀, 近藤 功, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 85, 10, 1513, 1521, 2002年10月01日
    ディジタル画像の著作権保護を目的として提案されている,各種電子透かし手法は,著作画像に,署名データや画像を埋め込む.そのため,著作画像の品質の劣化は避けられない.しかしながら,芸術性が追求される画像データは,もとの画質を保ったままで配信することが希望される場合がある.そこで,本論文では,透かし情報の埋込みを行わずに画像データを配布した場合でも,著者であることを主張することが可能な著者認証システムを提案する.提案手法は,画像符号化手法の一つとして知られているフラクタル画像符号化を応用して実現されており,符号化の際のIFSパラメータを認証パラメータとして,著作画像から,著者であることを主張する署名画像を抽出することを可能としている., 一般社団法人電子情報通信学会, 日本語
  • 上限値制約を伴うGA経路探索の実現に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 102, 296, 25, 30, 2002年08月28日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.本稿では,この手法を応用し,与えられた巡回経路長の上限値を超えない範囲で,最も多くの経由点を通る最適経路の探索手法を提案する.本探索問題は,単純に上限値を超えた個体を淘汰する手法を用いた場合,探索精度が悪化するという問題をもつ.この問題を解消するために,新たな二種類の手法を提案し,さらに実験により二提案手法の有効性について比較検討を行う., 一般社団法人電子情報通信学会, 日本語
  • GA及びSAを用いたフィルタ係数の量子化に関する考察
    松浦 大樹, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 102, 296, 31, 36, 2002年08月28日
    ディジタルフィルタを実現する場合,演算回路やレジスタは有限語長であるため,フィルタ係数を量子化する必要がある.このとき,フィルタの周波数特性に劣化が生じる.そこで,GA及びSAを用いて劣化を最小とするフィルタ係数を探索する手法が提案されている.本文では,この量子化手法において,探索精度の向上を目的として,GA及びSAの各々の設計に改良を行い,従来法との比較を行なう.また,フィルタの形状や係数値の量子化間隔を変更した上で実験を行ない,提案手法がこれらの問題設定に影響を受けずに高精度な探索を行なうことを確認する., 一般社団法人電子情報通信学会, 日本語
  • GAを用いた配電系統事故復旧問題の解法に関する考察
    中島 純, 稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 102, 296, 37, 42, 2002年08月28日
    配電系統事故復旧問題は,停電区間を最小にするだけでなく,復旧に要する操作時間を最短にする等,複数の最適化対象を持つ多目的最適化問題である.本稿では,遺伝的アルゴリズム(GA)の特徴に基づき,配電系統事故復旧問題のパレート最適解を集合として求める手法を提案する.本手法を用いることにより,多数の解候補から比較,検討し最適解を選ぶことができるため,ユーザの希望を正確に反映した最適解を得ることが可能となる.このような応用は,従来法を用いた場合には実現が困難であり,提案手法が有効である., 一般社団法人電子情報通信学会, 日本語
  • CORDIC適応ラティスフィルタの収束特性に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 102, 296, 43, 48, 2002年08月28日
    本文では,CORDICアルゴリズムを用いて実現された適応ラティスフィルタの収束特性について考察を行う.まず,フィルタ係数である回転角の収束特性を解析する.次に,収束後の定常状態における回転角について解析を行う.これらの解析により,回転角が真値に収束することが示される., 一般社団法人電子情報通信学会, 日本語
  • 上限値制約を伴うGA経路探索の実現に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. NLP, 非線形問題, 102, 298, 25, 30, 2002年08月28日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.本稿では,この手法を応用し,与えられた巡回経路長の上限値を超えない範囲で,最も多くの経由点を通る最適経路の探索手法を提案する.本探索問題は,単純に上限値を超えた個体を淘汰する手法を用いた場合,探索精度が悪化するという問題をもつ.この問題を解消するために,新たな二種類の手法を提案し,さらに実験により二提案手法の有効性について比較検討を行う., 一般社団法人電子情報通信学会, 日本語
  • GA及びSAを用いたフィルタ係数の量子化に関する考察
    松浦 大樹, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. NLP, 非線形問題, 102, 298, 31, 36, 2002年08月28日
    ディジタルフィルタを実現する場合,演算回路やレジスタは有限語長であるため,フィルタ係数を量子化する必要がある.このとき,フィルタの周波数特性に劣化が生じる.そこで,GA及びSAを用いて劣化を最小とするフィルタ係数を探索する手法が提案されている.本文では,この量子化手法において,探索精度の向上を目的として,GA及びSAの各々の設計に改良を行い,従来法との比較を行なう.また,フィルタの形状や係数値の量子化間隔を変更した上で実験を行ない,提案手法がこれらの問題設定に影響を受けずに高精度な探索を行なうことを確認する., 一般社団法人電子情報通信学会, 日本語
  • GAを用いた配電系統事故復旧問題の解法に関する考察
    中島 純, 稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. NLP, 非線形問題, 102, 298, 37, 42, 2002年08月28日
    配電系統事故復旧問題は,停電区間を最小にするだけでなく,復旧に要する操作時間を最短にする等,複数の最適化対象を持つ多目的最適化問題である.本稿では,遺伝的アルゴリズム(GA)の特徴に基づき,配電系統事故復旧問題のパレート最適解を集合として求める手法を提案する.本手法を用いることにより,多数の解候補から比較,検討し最適解を選ぶことができるため,ユーザの希望を正確に反映した最適解を得ることが可能となる.このような応用は,従来法を用いた場合には実現が困難であり,提案手法が有効である., 一般社団法人電子情報通信学会, 日本語
  • CORDIC適応ラティスフィルタの収束特性に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. NLP, 非線形問題, 102, 298, 43, 48, 2002年08月28日
    本文では,CORDICアルゴリズムを用いて実現された適応ラティスフィルタの収束特性について考察を行う.まず,フィルタ係数である回転角の収束特性を解析する.次に,収束後の定常状態における回転角について解析を行う.これらの解析により,回転角が真値に収束することが示される., 一般社団法人電子情報通信学会, 日本語
  • 強化学習を使用した線画像検出システムの構築に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 102, 220, 1, 6, 2002年07月12日
    インターネットの普及に伴い,画像の検出に対する需要が増加している.そこで本稿では特に線画像に着目し,所望の線画像をデータベース中から検出するための手法を提案する.提案手法では,Region,およびAspectとして定義される画像の局所的特徴を指標とし,ユーザが入力した画像とデータベース内の画像との間の類似度を算出する.算出された類似度は所望の画像を検出するための評価値となる.さらに,提案手法ではユーザの志向を画像検出に反映させるため,強化学習を取り入れる.強化学習では,所望の画像の選択などユーザが行う動作に着目し,検出対象画像の特徴を特に表現しているRegion,およびAspectに対して重み付けを行う.局所的特徴への重み付けを行うことにより,ユーザの志向に適応した画像の検出を実現する.本稿では,実験により提案手法の有効性を示す., 一般社団法人電子情報通信学会, 英語
  • 強化学習を使用した線画像検出システムの構築に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 102, 218, 1, 6, 2002年07月12日
    インターネットの普及に伴い,画像の検出に対する需要が増加している.そこで本稿では特に線画像に着目し,所望の線画像をデータベース中から検出するための手法を提案する.提案手法では,Region,およびAspectとして定義される画像の局所的特徴を指標とし,ユーザが入力した画像とデータベース内の画像との間の類似度を算出する.算出された類似度は所望の画像を検出するための評価値となる.さらに,提案手法ではユーザの志向を画像検出に反映させるため,強化学習を取り入れる.強化学習では,所望の画像の選択などユーザが行う動作に着目し,検出対象画像の特徴を特に表現しているRegion,およびAspectに対して重み付けを行う.局所的特徴への重み付けを行うことにより,ユーザの志向に適応した画像の検出を実現する.本稿では,実験により提案手法の有効性を示す., 一般社団法人電子情報通信学会, 英語
  • 強化学習を使用した線画像検出システムの構築に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 216, 1, 6, 2002年07月12日
    インターネットの普及に伴い,画像の検出に対する需要が増加している.そこで本稿では特に線画像に着目し,所望の線画像をデータベース中から検出するための手法を提案する.提案手法では,Region,およびAspectとして定義される画像の局所的特徴を指標とし,ユーザが入力した画像とデータベース内の画像との間の類似度を算出する.算出された類似度は所望の画像を検出するための評価値となる.さらに,提案手法ではユーザの志向を画像検出に反映させるため,強化学習を取り入れる.強化学習では,所望の画像の選択などユーザが行う動作に着目し,検出対象画像の特徴を特に表現しているRegion,およびAspectに対して重み付けを行う.局所的特徴への重み付けを行うことにより,ユーザの志向に適応した画像の検出を実現する.本稿では,実験により提案手法の有効性を示す., 一般社団法人電子情報通信学会, 英語
  • シーンカット検出のための MPEG Audio データのクラスタリングに関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 102, 219, 7, 12, 2002年07月11日
    シーンの境界であるシーンカットの検出法として,オーディオ信号の変化部に着眼した手法が提案されている.しかし,オーディオ信号にはしばしば無音部が挿入されるため,オーディオ信号の変化部にはシーンカットのみならず,有音部と無音部の境界が含まれてしまい,全ての変化部がシーンカットとは限らない.従って,オーディオ信号の変化部のみからシーンカットを検出することは困難となる.そこで本文では,オーディオ信号の変化部を検出し,変化部を境界として得られたセグメントを有音部と無音部に分類することで,高精度にシーンカットを検出する手法を提案する.また,提案手法はMPEG Audioで符号化されたデータに対し,復号せずに直接処理を行なうことが可能であり,MPEGで符号化された動画像でのシーンカット検出への適応が期待できる., 一般社団法人電子情報通信学会, 日本語
  • シーンカット検出のための MPEG Audio データのクラスタリングに関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 102, 217, 7, 12, 2002年07月11日
    シーンの境界であるシーンカットの検出法として,オーディオ信号の変化部に着眼した手法が提案されている.しかし,オーディオ信号にはしばしば無音部が挿入されるため,オーディオ信号の変化部にはシーンカットのみならず,有音部と無音部の境界が含まれてしまい,全ての変化部がシーンカットとは限らない.従って,オーディオ信号の変化部のみからシーンカットを検出することは困難となる.そこで本文では,オーディオ信号の変化部を検出し,変化部を境界として得られたセグメントを有音部と無音部に分類することで,高精度にシーンカットを検出する手法を提案する.また,提案手法はMPEG Audioで符号化されたデータに対し,復号せずに直接処理を行なうことが可能であり,MPEGで符号化された動画像でのシーンカット検出への適応が期待できる., 一般社団法人電子情報通信学会, 日本語
  • シーンカット検出のための MPEG Audio データのクラスタリングに関する一考察
    二反田 直己, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 102, 215, 7, 12, 2002年07月11日
    シーンの境界であるシーンカットの検出法として,オーディオ信号の変化部に着眼した手法が提案されている.しかし,オーディオ信号にはしばしば無音部が挿入されるため,オーディオ信号の変化部にはシーンカットのみならず,有音部と無音部の境界が含まれてしまい,全ての変化部がシーンカットとは限らない.従って,オーディオ信号の変化部のみからシーンカットを検出することは困難となる.そこで本文では,オーディオ信号の変化部を検出し,変化部を境界として得られたセグメントを有音部と無音部に分類することで,高精度にシーンカットを検出する手法を提案する.また,提案手法はMPEG Audioで符号化されたデータに対し,復号せずに直接処理を行なうことが可能であり,MPEGで符号化された動画像でのシーンカット検出への適応が期待できる., 一般社団法人電子情報通信学会, 日本語
  • 神経細胞が運ぶ情報量の実測における標本サイズの影響
    村上 準, 木立 智英, 長谷川 美紀, 下澤 楯夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 85, 7, 1233, 1243, 2002年07月01日
    神経系の動作性能は,神経細胞が運ぶ情報量で記述すべきである.神経細胞は刺激波形を離散的なパルス(スパイク)列に変換するパルス符号化器として振舞うため,実際の情報伝送速度は,有限長の観測時間内に得られる有限個のスパイクから推定することになり,誤差を含むことになる.本論文では,刺激-応答間のコヒーレンスから情報伝送速度を求める場合について,この推定誤差と標本サイズ(総スパイク数)との関係を解析した.その結果,スパイク当りの情報量の推定誤差は,推定に用いる総スパイク数に反比例することが得られた.また,異なる神経細胞より計測した情報量を比べるには,反比例の収束値である真の情報量を用いるべきであることを述べる.また,上記の標本数とスパイク当りの情報量の関係が成立することを,実物のコオロギの気流感覚細胞から得たデータにより確認する., 一般社団法人電子情報通信学会, 日本語
  • Experimental mobile video communication using PHS
    Satoshi Miyaji, Osamu Sugimoto, Shuichi Matsumoto, Fumihide Kojima, Katsuyoshi Sato, Masayuki Fujise, Miki Haseyama, Hideo Kitajima, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 56, 3, 455, 462, 2002年03月01日
    Real-time video communication was tested in a mobile environment using PHS and a very low bit-rate video codec. A vehicle equipped with PHS and the codec performed video communication with an indoor system while running along a given course. The communication protocols were PIAFS 32k (actually 29.2 kb/s) and UDP/IP. How throughput and picture quality were affected by the speed of the vehicle and how the electromagnetic-field intensity fluctuated with vehicle movement were measured. Results from this experiment revealed parameters of the video coding and packetizing ideal for use in mobile communication. The experiments showed that PHS could provide real-time mobile video communication at low to middle speeds within a service area., 一般社団法人映像情報メディア学会, 日本語
  • A Simplification Method for Line Drawings which Retains the Shape by Using the Fractal Dimension
    UEMURA Satoshi, HASEYAMA Miki, KITAJIMA Hideo, IEICE transactions on information and systems, 85, 3, 601, 601, 2002年03月01日
    We present a novel simplification method for line drawings which retains the shape by using the fractal dimension as an index. By using such an index, it is possible to evaluate the degree of simplificaton. Hence we can realize the simplification that retains the approximate shape of original object by observing the degree of simplification with the fractal dimension. In order to simplify retaining the approximate shape of the original object, we extract the feature points based on the state of unevenness analyzed using an approach taken from a vector tracer method., 一般社団法人電子情報通信学会, 英語
  • PHSを用いた移動体動画像通信実験
    宮地 悟史, 杉本 修, 松本 修一, 児島 史秀, 佐藤 勝善, 藤瀬 雅行, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 56, 3, 455, 462, 2002年03月01日
    Real-time video communication was tested in a mobile environment using PHS and a very low bit-rate video codec. A vehicle equipped with PHS and the codec performed video communication with an indoor system while running along a given course. The communication protocols were PIAFS 32k (actually 29.2 kb/s) and UDP/IP. How throughput and picture quality were affected by the speed of the vehicle and how the electromagnetic-field intensity fluctuated with vehicle movement were measured. Results from this experiment revealed parameters of the video coding and packetizing ideal for use in mobile communication. The experiments showed that PHS could provide real-time mobile video communication at low to middle speeds within a service area., 一般社団法人映像情報メディア学会, 日本語
  • フラクタル次元を指標とした線画像の概形を保持した単純化法
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 = The transactions of the Institute of Electronics, Information and Communication Engineers. D-II, 85, 3, 435, 447, 2002年03月01日
    本論文では,自然形状がもつ統計的自己相似性に注目し,従来,複雑さの尺度として用いられてきたフラクタル次元を指標とした線画像の単純化手法を提案する.指標を導入することで,単純化図形の単純化の度合を定量的に評価することが可能となる.提案手法では,この指標を用いて単純化の度合を観察しながら,原図形の概形を保持した単純化を実現する.原図形の概形を保持するために提案手法では,ベクトルトレーサ法に着想を得た手法を用いて,原図形の凹凸状態を解析することによって単純化後に概形を残すために必要なデータ点を特徴点として抽出する.本論文の最後では,提案手法の有効性を示すためにいくつかの実験結果を示す.更に,客観的評価方法を導入し,既存の単純化手法により得られた図形と比較を行い,その結果も併せて示す., 一般社団法人電子情報通信学会, 日本語
  • SAR画像中のテクスチャに着目したノイズ低減のためのカルマンフィルタ
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. B, 通信 = The transactions of the Institute of Electronics, Information and Communication Engineers. B, 85, 2, 266, 277, 2002年02月01日
    本論文では,カルマンフィルタを用いた合成開口レーダ(SAR)画像中のノイズ低減のための手法を提案する.SAR画像中に含まれるノイズは主にスペックルより生じ,ゴマ塩状の濃淡となって現れる.スペックルはその統計的な性質が乗法性であることが知られているが,領域によってはこの性質が成り立たないことが指摘されており,十分な除去が難しい.またレーダにおいて,後方散乱波は,反射する対象物体の種類によりその期待値が変化する.提案手法は,画像をそのテクスチャによりいくつかの領域に分類し,カルマンフィルタ処理の際にパラメータを領域に応じ変化させる.このようなパラメータの変化により,実際のSAR画像中での主にスペックルにより生じるノイズ及び後方散乱波の統計的性質の変化を考慮した処理が可能となる.本論文では,ノイズの低減効果を定量的に評価するために作成したテスト画像及び実際のSAR画像に提案手法を適用し,その結果を示す., 一般社団法人電子情報通信学会, 日本語
  • インパルス性雑音除去のための非線形フィルタによる雑音検知に関する考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 9, 43, 48, 2002年01月30日
    本論文では,インパルス性雑音によって劣化した画像の復元を目的として,高精度な雑音検出法を提案する.雑音検出と雑音除去の2つの処理によって画像復元を行う手法において,雑音除去は雑音検出の結果を用いて行われる.それゆえ,雑音検出の性能が復元精度に大きな影響を与えることから,復元結果の精度を向上させるためには,雑音検出の精度向上が必須である.そこで,本文では,一度得られたノイズフラグ画像に対してインパルス性雑音か否かを再度検証することにより,高精度な雑音検出を実現する.その結果,提案手法を用いることにより,高精度な復元画像を得ることが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • FIFを用いた輪郭線形状の表現法に関する一考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 9, 49, 54, 2002年01月30日
    フラクタルモデルの1つであるFractal Interpolation Functions (FIF)を用いた輪郭線形状の表現法を提案する.従来のFIFでは,その適用範囲が1価関数で表される離散信号に限定されていた.そこで,本文では,媒介変数を導入することでその概念を拡張し,物体の輪郭線等,多価関数で表される離散信号への適用を可能とする手法を提案する.提案手法では,FIFを適用する際に必要となるパラメータを複雑さの尺度であるフラクタル次元を指標として決定する.これにより,対象形状の複雑さに応じたモデル化を実現することが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • ナーススケジューリング問題のGAによる解法に関する考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 9, 125, 130, 2002年01月30日
    多目的最適化問題の一つである,看護婦の勤務表を作成する問題(NSP)に対して,遺伝的アルゴリズム(GA)を用いた手法が手案されている.この手法では,複数の目的関数の重み付き和を評価関数とすることにより,パレート最適解集合から唯一の解が決定される.しかしながら,各目的関数のダイナミックレンジが異なる場合,その評価関数の最適化は困難となる.そこで,各目的関数の標準偏差に着眼し,重みを適切に設定することで,上記の問題を回避する.GAによるNSPの解法を提案する.これにより,柔軟な評価関数の設定が可能となる.本文では,更に,提案された最適化手法の特徴に基づき,評価関数に看護婦個人の満足の度合を反影し,より実用に適したスケジューリングシステムを実現する., 一般社団法人映像情報メディア学会, 日本語
  • GA及びSAを用いた対応点探索の高精度化における一考察
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 9, 131, 136, 2002年01月30日
    本稿では,既に提案されている遺伝的アルゴリズム(GA : Genetic Algorithm)及び焼きなまし法(SA : Simulated Annealing)を用いた対応づけ問題の解法を改良し,より高精度な結果を得る手法を提案する.従来法では,最適解に近い評価を得る局所解が存在するため,局所解に陥りやすいという問題がある.提案手法では,GAの探索過程において,各個体の遺伝子に注目し,局所解に陥る確率を減少させることで,効率的に最適な対応づけを探索する., 一般社団法人映像情報メディア学会, 日本語
  • 高精度なフラクタル画像符号化 : IFSパラメータの決定法に関する考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 26, 9, 137, 142, 2002年01月30日
    フラクタル画像符号化において,縮小写像の決定は重要な問題である.なぜなら,再生画像の品質が,縮小写像により大きく左右されるからである.従来のフラクタル画像符号化では,コラージュ定理に基づき,原画像に対し一回の縮小写像を施し得られる画像(コラージュ)と原画像との誤差(コラージュ誤差)を最小とする縮小写像を最良の写像として決定する.コラージュ定理は,コラージュ誤差が小さい場合に,そのコラージュを生成する縮小写像を任意の初期画像に繰り返し施して得られる再生画像が原画像を良く近似することを保証している.しかしながら,実際には,コラージュ誤差が小さいとは限らず,従来のフラクタル画像符号化で決定される縮小写像を用いても,原画像に近い再生画像が得られるとは限らない.そこで,本文では,再生画像と原画像との誤差をGAおよびSAにより最小化することで縮小写像を決定する新たな手法を提案する.本文で提案する手法を用いることで,原画像に最も近い画像を再生することが可能なIFSパラメータを決定できる., 一般社団法人映像情報メディア学会, 日本語
  • インパルス性雑音除去のための非線形フィルタによる雑音検知に関する考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 101, 625, 43, 48, 2002年01月23日
    本論文では, インパルス性雑音によって劣化した画像の復元を目的として, 高精度な雑音検出法を提案する.雑音検出と雑音除去の2つの処理によって画像復元を行う手法において, 雑音除去は雑音検出の結果を用いて行われる.それゆえ, 雑音検出の性能が復元精度に大きな影響を与えることから, 復元結果の精度を向上させるためには, 雑音検出の精度向上が必須である.そこで, 本文では, 一度得られたノイズフラグ画像に対してインパルス性雑音か否かを再度検証することにより, 高精度な雑音検出を実現する.その結果, 提案手法を用いることにより, 高精度な復元画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • FIFを用いた輪郭線形状の表現法に関する一考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 101, 625, 49, 54, 2002年01月23日
    フラクタルモデルの1つであるFractal Interpolation Functions(FIF)を用いた輪郭線形状の表現法を提案する.従来のFIFでは, その適用範囲が1価関数で表される離散信号に限定されていた.そこで, 本文では, 媒介変数を導入することでその概念を拡張し, 物体の輪郭線等, 多価関数で表される離散信号への適用を可能とする手法を提案する.提案手法では, FIFを適用する際に必要となるパラメータを複雑さの尺度であるフラクタル次元を指標として決定する.これにより, 対象形状の複雑さに応じたモデル化を実現することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • ナーススケジューリング問題のGAによる解法に関する考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 101, 625, 125, 130, 2002年01月23日
    多目的最適化問題の一つである, 看護婦の勤務表を作成する問題(NSP)に対して, 遺伝的アルゴリズム(GA)を用いた手法が提案されている.この手法では, 複数の目的関数の重み付き和を評価関数とすることにより, パレート最適解集合から唯一の解が決定される.しかしながら, 各目的関数のダイナミックレンジが異なる場合, その評価関数の最適化は困難となる.そこで, 各目的関数の標準偏差に着眼し, 重みを適切に設定することで, 上記の問題を回避する, GAによるNSPの解法を提案する.これにより, 柔軟な評価関数の設定が可能となる.本文では, 更に, 提案された最適化手法の特徴に基づき, 評価関数に看護婦個人の満足の度合を反影し, より実用に適したスケジューリングシステムを実現する., 一般社団法人電子情報通信学会, 日本語
  • GA及びSAを用いた対応点探索の高精度化における一考察
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 101, 625, 131, 136, 2002年01月23日
    本稿では, 既に提案されている遺伝的アルゴリズム(GA : Genetic Algorithm)及び焼きなまし法(SA : Simulated Annealing)を用いた対応づけ問題の解法を改良し, より高精度な結果を得る手法を提案する.従来法では, 最適解と近い評価を得る局所解が存在するため, 局所解に陥りやすいという問題がある.提案手法では, GAの探索過程において, 各個体の遺伝子に注目し, 局所解に陥る確率を減少させることで, 効率的に最適な対応づけを探索する., 一般社団法人電子情報通信学会, 日本語
  • 高精度なフラクタル画像符号化 : IFSパラメータの決定法に関する考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. ITS, 101, 625, 137, 142, 2002年01月23日
    フラクタル画像符号化において, 縮小写像の決定は重要な問題である.なぜなら, 再生画像の品質が, 縮小写像により大きく左右されるからである.従来のフラクタル画像符号化では, コラージュ定理に基づき, 原画像に対し一回の縮小写像を施し得られる画像(コラージュ)と原画像との誤差(コラージュ誤差)を最小とする縮小写像を最良の写像として決定する.コラージュ定理は, コラージュ誤差が小さい場合に, そのコラージュを生成する縮小写像を任意の初期画像に繰り返し施して得られる再生画像が原画像を良く近似することを保証している.しかしながら, 実際には, コラージュ誤差が小さいとは限らず, 従来のフラクタル画像符号化で決定される縮小写像を用いても, 原画像に近い再生画像が得られるとは限らない.そこで, 本文では, 再生画像と原画像との誤差をGAおよびSAにより最小化することで縮小写像を決定する新たな手法を提案する.本文で提案する手法を用いることで, 原画像に最も近い画像を再生することが可能なIFSパラメータを決定できる., 一般社団法人電子情報通信学会, 日本語
  • インパルス性雑音除去のための非線形フィルタによる雑音検知に関する考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 627, 43, 48, 2002年01月23日
    本論文では, インパルス性雑音によって劣化した画像の復元を目的として, 高精度な雑音検出法を提案する.雑音検出と雑音除去の2つの処理によって画像復元を行う手法において, 雑音除去は雑音検出の結果を用いて行われる.それゆえ, 雑音検出の性能が復元精度に大きな影響を与えることから, 復元結果の精度を向上させるためには, 雑音検出の精度向上が必須である.そこで, 本文では, 一度得られたノイズフラグ画像に対してインパルス性雑音か否かを再度検証することにより, 高精度な雑音検出を実現する.その結果, 提案手法を用いることにより, 高精度な復元画像を得ることが可能となる., 一般社団法人電子情報通信学会, 日本語
  • FIFを用いた輪郭線形状の表現法に関する一考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 627, 49, 54, 2002年01月23日
    フラクタルモデルの1つであるFractal Interpolation Functions(FIF)を用いた輪郭線形状の表現法を提案する.従来のFIFでは, その適用範囲が1価関数で表される離散信号に限定されていた.そこで, 本文では, 媒介変数を導入することでその概念を拡張し, 物体の輪郭線等, 多価関数で表される離散信号への適用を可能とする手法を提案する.提案手法では, FIFを適用する際に必要となるパラメータを複雑さの尺度であるフラクタル次元を指標として決定する.これにより, 対象形状の複雑さに応じたモデル化を実現することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • ナーススケジューリング問題のGAによる解法に関する考察
    大谷 慎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 627, 125, 130, 2002年01月23日
    多目的最適化問題の一つである, 看護婦の勤務表を作成する問題(NSP)に対して, 遺伝的アルゴリズム(GA)を用いた手法が提案されている.この手法では, 複数の目的関数の重み付き和を評価関数とすることにより, パレート最適解集合から唯一の解が決定される.しかしながら, 各目的関数のダイナミックレンジが異なる場合, その評価関数の最適化は困難となる.そこで, 各目的関数の標準偏差に着眼し, 重みを適切に設定することで, 上記の問題を回避する, GAによるNSPの解法を提案する.これにより, 柔軟な評価関数の設定が可能となる.本文では, 更に, 提案された最適化手法の特徴に基づき, 評価関数に看護婦個人の満足の度合を反影し, より実用に適したスケジューリングシステムを実現する., 一般社団法人電子情報通信学会, 日本語
  • GA及びSAを用いた対応点探索の高精度化における一考察
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 627, 131, 136, 2002年01月23日
    本稿では, 既に提案されている遺伝的アルゴリズム(GA : Genetic Algorithm)及び焼きなまし法(SA : Simulated Annealing)を用いた対応づけ問題の解法を改良し, より高精度な結果を得る手法を提案する.従来法では, 最適解と近い評価を得る局所解が存在するため, 局所解に陥りやすいという問題がある.提案手法では, GAの探索過程において, 各個体の遺伝子に注目し, 局所解に陥る確率を減少させることで, 効率的に最適な対応づけを探索する., 一般社団法人電子情報通信学会, 日本語
  • 高精度なフラクタル画像符号化 : IFSパラメータの決定法に関する考察
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 627, 137, 142, 2002年01月23日
    フラクタル画像符号化において, 縮小写像の決定は重要な問題である.なぜなら, 再生画像の品質が, 縮小写像により大きく左右されるからである.従来のフラクタル画像符号化では, コラージュ定理に基づき, 原画像に対し一回の縮小写像を施し得られる画像(コラージュ)と原画像との誤差(コラージュ誤差)を最小とする縮小写像を最良の写像として決定する.コラージュ定理は, コラージュ誤差が小さい場合に, そのコラージュを生成する縮小写像を任意の初期画像に繰り返し施して得られる再生画像が原画像を良く近似することを保証している.しかしながら, 実際には, コラージュ誤差が小さいとは限らず, 従来のフラクタル画像符号化で決定される縮小写像を用いても, 原画像に近い再生画像が得られるとは限らない.そこで, 本文では, 再生画像と原画像との誤差をGAおよびSAにより最小化することで縮小写像を決定する新たな手法を提案する.本文で提案する手法を用いることで, 原画像に最も近い画像を再生することが可能なIFSパラメータを決定できる., 一般社団法人電子情報通信学会, 日本語
  • Estimation of the vanishing point for automatic driving system using a cross ratio
    Masato Kazui, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 33, 9, 31, 40, 2002年
    This paper proposes a new method to estimate the vanishing point used as the vehicle heading, which is essential in automatic driving systems. The proposed method uses a cross ratio comprised of a ratio of lengths from four collinear points for extracting the edges that shape the vanishing point. Then, lines that intersect at one point are fitted to the edges in a Hough space. Consequently, the vanishing point is estimated robustly even when the lane markings are occluded by other vehicles. In the presence of lane markings, the road boundaries are also estimated at the same time. Experimental results from images of a real road scene show the effectiveness of the proposed method., 英語
  • Efficient contour shape description by using fractal interpolation functions
    S Uemura, M Haseyama, H Kitajima, 2002 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOL I, PROCEEDINGS, 1, 485, 488, 2002年
    This paper presents a novel representation method for contour shape using Fractal Interpolation Functions (FIF). In the traditional idea of the FIF, the scope of its application has been limited to the case where the signal is represented by a single-valued function. Therefore, the traditional FIF cannot be applicable to multiple-valued signals. The proposed method can model a multiple-valued signal with an extended FIF derived by introducing new parameters to the traditional one. Furthermore, the proposed method utilizes the fractal dimension known as a measure of complexity to determine the parameters in the FIF and thereby can model the signal based on its complexity. Experimental results show the validity of the proposed method., IEEE, 英語
  • An accurate noise detector for image restoration
    K Kondo, M Haseyama, H Kitajima, 2002 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOL I, PROCEEDINGS, 1, 321, 324, 2002年
    This paper proposes a new noise-detection method for restoration of images corrupted by impulsive noise. The proposed method consists of two stages. In the first stage, the pixels classified according to a new flag image are processed by different noise detectors. They are realized by using two median filters with different sizes of windows. In the second stage, each pixel once detected as an impulse in the first stage is verified by using a new system. According to the above stages, the proposed method can accurately detect the location of the impulsive noise and be effectively used as a preprocessor for noise reduction filtering. Experiments show that the proposed method can effectively detect impulsive noises in noisy images even when they are very highly corrupted., IEEE, 英語
  • A cost-effective and high-precision architecture for cordic-based adaptive lattice filters
    S Shiraishi, M Haseyama, H Kitajima, 2002 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL V, PROCEEDINGS, 5, 297, 300, 2002年
    This paper presents a CORDIC-based architecture for adaptive lattice filters. The proposed filter architecture consists of simple components: a CORDIC processor and an adder, so that it can be implemented with a reduced amount of hardware. Moreover, the proposed architecture is useful for ASIC design because it has a regular, modular, and locally-connected structure. In addition, since our architecture is effective even in case of ARMA lattice filters, it can be utilized for many applications in the digital signal processing field., IEEE, 英語
  • A fast, multi-class algorithm for classifying aerial images
    John W. Gates, Miki Haseyama, Hideo Kitajima, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 56, 5, 826, 835, 2002年
    An approach is described for classifying images that does not require first dividing an image into small blocks and then classifying it based on the features of the individual blocks, as do traditional approaches. Instead the line features of the entire image are extracted and used, along with the pixel intensity, to classify each pixel in the image. To increase the classification speed, a fast line-extraction algorithm has been developed that extracts the line features directly from the original image without pre-processing. A classification tree with single variable splits is used to classify the image. Testing of a five-class aerial-image classification algorithm showed that it had an average error rate of 17.6%. Running on a 600-MHz Pentium III processor, it had an average classification time of 2.18 seconds for 512 × 512 grayscale images. This approach can be used for many different applications by training the classification tree with the desired classes., Inst. of Image Information and Television Engineers, 英語
  • フラクタル画像符合化におけるGAを用いたIFSパラメータの量子化法
    竹沢 恵, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 56, 10, 1633, 1642, 2002年
    This paper proposes a high-accuracy quantization method for IFS parameters in fractal image coding by using genetic algorithms (GA). The development of IFS-parameter quantization methods is significant for image coding because quantization errors have a negative influence on reconstructed image quality. The conventional method quantizes the IFS parameters to the nearest possible values and thus minimizes the quantization errors. However, it does not necessarily minimize the errors in images reconstructed from an original. Therefore, a new quantization method which minimizes that error is proposed. The proposed method consists of two GAs; because if a simple GA searches for the optimal quantization-parameter set, it converges to local optima because of the complexity of the search space. Experimental results verify that the proposed method can effectively find the optimal quantization-parameter set and provide high-quality reconstructed images., 一般社団法人映像情報メディア学会, 日本語
  • アフィン動きパラメータ推定のための専用ハードウェアに関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 25, 84, 1, 6, 2001年12月14日
    動画像からの動き推定法として, アフィン動きモデルを用いた手法が提案されている.この手法を用いることにより, 動画像内の回転や伸縮などの複雑な動きを推定可能となるが, 反面, 多量の計算が必要になるという問題がある.そこで, 本文では, 専用ハードウェアによりこの計算量の問題を解決することを目的として, アフィン動きパラメータ推定のためのVLSIアーキテクチャを導出する.さらに, 本文では, 導出されたアーキテクチャを単純化し, かつ高スループット化する手法を提案する.また, 本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計することにより, FPGA上での実現について検討する., 一般社団法人映像情報メディア学会, 日本語
  • 動画像符号化におけるレート歪特性改善のための動きベクトル決定法
    夏井 知義, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 25, 84, 7, 12, 2001年12月14日
    一般的なブロックマッチングアルゴリズムにおいて, 動きベクトルは, 輝度値の平均二乗誤差(MSE)や平均絶対値誤差(MAE)が最小となる位置から決定される.しかし背景画像などの輝度勾配が緩やかな部分において, MSEが最小の動きベクトルが最良のレート歪特性を導くとは限らない.そこで, 動き補償予測符号化に要する符号量, 予測誤差交換符号化に要する符号量、再構成歪の三つの要素に注目して, 最良のレート歪特性を導く動きベクトルを決定する手法を提案する.H.263の符号化器を使用時に, 従来手法と比較して, 提案手法は同PSNRで総符号量を約10%〜50%削減可能である., 一般社団法人映像情報メディア学会, 日本語
  • アフィン動きパラメータ推定のための専用ハードウェアに関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2001, 121, 61, 66, 2001年12月13日
    動画像からの動き推定法として,アフィン動きモデルを用いた手法が提案されている。この手法を用いることにより,動画像内の回転や伸縮などの複雑な動きを推定可能となるが,反面,多量の計算が必要になるという問題がある。そこで,本文では,専用ハードウェアによりこの計算量の問題を解決することを目的として,アフィン動きパラメータ推定のためのVLSIアーキテクチャを導入する。さらに,本文では,導入されたアーキテクチャを単純化し,かつ高スループット化する手法を提案する。また,本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計することにより,FPGA上での実現について検討する。This paper proposes an atchitecture for an affine-based motion estimation algorithm. Although an affine-based motion estimation algorithm can estimate accurate motion from image sequences, it requires high computational power. In order to avoid such computational complexity, we propose a hardware architecture for the motion estimator. Furthermore, propose a method to achive high throughput and low hardware complexity in the motion estimator. In this paper, we describe the motion estimator in VHDL and then show the result of design using an FPGA., 一般社団法人情報処理学会, 日本語
  • 動画像符号化におけるレート歪特性改善のための動きベクトル決定法
    夏井 知義, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2001, 121, 67, 72, 2001年12月13日
    一般的なブロックマッチングアルゴリズムにおいて,動きベクトルは,輝度勾配が緩やかな部分において,MSEが最小の動きベクトルが最良のレート歪特性を導くとは限らない。そこで,動き補償予測符号化に要する符号量,予測誤差変換符号化に要する符号量,再構成歪の三つの要素に注目して,最良のレート歪特性を導く動きベクトルを決定する手法を提案する。H.263の符号化器を使用時に,従来手法と比較して,提案手法は同PSNRで総符号量を約10%?50%削減可能である。In ordinary Block Matching Algorithms(BMA), motion vectors are defined at the point to minimize the Mean Squared Error(MSE) or the Mean Absolutte Error(MAE) of the intensity. However, in certain background images, the motion vectors whose MSE is minimum may not yield the best rate-distortion performance. Therefore, we propose a method to define the motion vectors which yield the best rate-distortion performance which is composed of three elements, the bit rate required for motion compensated predictive coding, the bit rate required for prediction error transforming coding, and the reconstruction distortion. If the codec is H.263, the proposed method can reduce the total bit rate approximately 10%-50% with the same PSNR as compared to the conventional methods., 一般社団法人情報処理学会, 日本語
  • アフィン動きパラメータ推定のための専用ハードウェアに関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 497, 1, 6, 2001年12月07日
    動画像からの動き推定法として, アフィン動きモデルを用いた手法が提案されている.この手法を用いることにより, 動画像内の回転や伸縮などの複雑な動きを推定可能となるが, 反面, 多量の計算が必要になるという問題がある.そこで, 本文では, 専用ハードウェアによりこの計算量の問題を解決することを目的として, アフィン動きパラメータ推定のためのVLSIアーキテクチャを導出する.さらに, 本文では, 導出されたアーキテクチャを単純化し, かつ高スループット化する手法を提案する.また, 本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計することにより, FPGA上での実現について検討する., 一般社団法人電子情報通信学会, 日本語
  • 動画像符号化におけるレート歪特性改善のための動きベクトル決定法
    夏井 知義, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 101, 497, 7, 12, 2001年12月07日
    一般的なブロックマッチングアルゴリズムにおいて, 動きベクトルは, 輝度値の平均二乗誤差(MSE)や平均絶対値誤差(MAE)が最小となる位置から決定される.しかし背景画像などの輝度勾配が緩やかな部分において, MSEが最小の動きベクトルが最良のレート歪特性を導くとは限らない.そこで, 動き補償予測符号化に要する符号量, 予測誤差変換符号化に要する符号量, 再構成歪の三つの要素に注目して, 最良のレート歪特性を導く動きベクトルを決定する手法を提案する.H.263の符号化器を使用時に, 従来手法と比較して, 提案手法は同PSNRで総符号量を約10%〜50%削減可能である., 一般社団法人電子情報通信学会, 日本語
  • アフィン動きパラメータ推定のための専用ハードウェアに関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 101, 495, 1, 6, 2001年12月07日
    動画像からの動き推定法として, アフィン動きモデルを用いた手法が提案されている.この手法を用いることにより, 動画像内の回転や伸縮などの複雑な動きを推定可能となるが, 反面, 多量の計算が必要になるという問題がある.そこで, 本文では, 専用ハードウェアによりこの計算量の問題を解決することを目的として, アフィン動きパラメータ推定のためのVLSIアーキテクチャを導出する.さらに, 本文では, 導出されたアーキテクチャを単純化し, かつ高スループット化する手法を提案する.また, 本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計することにより, FPGA上での実現について検討する., 一般社団法人電子情報通信学会, 日本語
  • 動画像符号化におけるレート歪特性改善のための動きベクトル決定法
    夏井 知義, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 101, 495, 7, 12, 2001年12月07日
    一般的なブロックマッチングアルゴリズムにおいて, 動きベクトルは, 輝度値の平均二乗誤差(MSE)や平均絶対値誤差(MAE)が最小となる位置から決定される.しかし背景画像などの輝度勾配が緩やかな部分において, MSEが最小の動きベクトルが最良のレート歪特性を導くとは限らない.そこで, 動き補償予測符号化に要する符号量, 予測誤差変換符号化に要する符号量, 再構成歪の三つの要素に注目して, 最良のレート歪特性を導く動きベクトルを決定する手法を提案する.H.263の符号化器を使用時に, 従来手法と比較して, 提案手法は同PSNRで総符号量を約10%〜50%削減可能である., 一般社団法人電子情報通信学会, 日本語
  • A new fitness function of a genetic algorithm for routing applications
    Jun Inagaki, Miki Haseyama, Hideo Kitajima, IEICE Transactions on Information and Systems, E84-D, 277, 280, 2001年12月01日
    SUMMARY This paper presents a method of determining a fitness function in a genetic algorithm for routing the shortest route via several designated points. We can search for the optimum route efficiently by using the proposed fitness function and its validity is verified by applying it to the actual map data.
  • MFM像を用いた媒体の磁気クラスタ構造の2次元解析
    武隈 育子, 長谷山 美紀, 末岡 和久, 武笠 幸一, 日本応用磁気学会誌 = Journal of Magnetics Society of Japan, 25, 10, 1535, 1540, 2001年10月01日
    This paper analyzes two-dimensional features of the magnetic microstructure of longitudinal thin-film media. Several MFM analyses of the magnetic cluster size have been presented, but the two-dimensional features of the clusters are not well understood. In order to determine these features, we focused on the distribution of magnetic poles at the boundaries of magnetic clusters, and quantitatively analyzed it by using two kinds of image processing methods: binarization and thinning methods. The results were as follows: (1) we found that some media showed dependence on the specific direction in the distribution of magnetic poles in the dc-erased state, whose features are closely related to the magnetization fluctuations in transition regions, and (2) media with larger fluctuations in the transition region had larger N_m/S_o values and partial erasure (PE) probabilities., 公益社団法人日本磁気学会, 日本語
  • 線分の方向性を用いた高速直線抽出法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理, 84, 8, 1566, 1579, 2001年08月01日
    本論文は,ディジタル直線を構成する線分の方向性を用いた高速直線抽出法を提案する.画像中の物体の特徴を抽出する際,その輪郭を線分の組合せとして抽出することは重要である.短い線分と長い線分とが混在している場合,従来手法は,抽出精度が不十分であり,処理時間も長い.本論文においては,(1)1本のアナログ直線は,対応する離散画像においては,離散化された複数の線分が連結されたものとして表現されること,(2)与えられるアナログ直線の傾きの範囲によって,対応するディジタル画像中の線分の方向が異なることに着目する.各々の線分の4方向に対応するアナログ直線の傾きの範囲内で,線分を追跡することにより直線抽出の高速化を図る.評価実験の結果により,処理速度,ロバスト性,結果の精度において提案手法が従来手法に対して優れていることを示す., 一般社団法人電子情報通信学会, 日本語
  • Adaptive Use of Long-Term Memory for Motion Compensation
    Rivero Jorge F., Kitajima Hideo, Haseyama Miki, 研究会講演予稿, 187, 11, 16, 2001年07月25日
    画像電子学会, 英語
  • 線画像認識システムの構築に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 101, 204, 99, 104, 2001年07月11日
    本文では, 線画像の特徴を認識し, 所望の線画像に類似した画像をデータベース中から検出するための新たなシステムを提案する.提案手法では, 分割された複数の領域から円形度, 隠ぺい度などの特徴量を算出し, それらを用いて画像間の類似度を算出する.また, 強化学習を行なうことにより, 画像を際だって特徴づける部分に重みづけを行い, 高精度な認識を実現する.本文では, 実験により提案手法の特徴量の有効性, および強化学習の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • 対応点決定法におけるGA及びSAを用いた探索手法の改善
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 101, 204, 119, 124, 2001年07月11日
    二枚の画像に存在する同一物体の対応付けを遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いて探索する手法が既に提案されている.しかしながら, 二枚の画像間で同一物体の大きさが異なる場合, 最適回を得るために複数回探索を行なう必要がある.本稿では, 従来法の探索アルゴリズムである遺伝的アルゴリズムを改良し, 一回の探索で従来の探索と同様の結果を得る手法を提案する.また, 実験を行ない, その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • エッジ保存を考慮した適応カルマンフィルタによる画像復元法
    松村 淳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 101, 204, 125, 130, 2001年07月11日
    本文では, 画像の性質に適応したモデル化法を提案し, そのモデルから導出されるカルマンフィルタにより, 画像のエッジ保存及び効果的なノイズの平滑化を実現する.カルマンフィルタを用いて劣化画像より雑音除去を行う場合, ノイズの平滑化とともに画像の特徴的な構造であるエッジ部も同時に平滑化され, ぼけた復元画像が得られる.そこで本手法では, 画像を平坦部とエッジ部に分類し, それぞれに適した画像のモデルを推定することにより, 過剰な平滑化を避けた高精度な復元を可能とする.更に, それぞれのモデルから設計されるカルマンフィルタを画像の各部分に適応的に用い, 画像の細部に適した復元を実現する.この結果, 画像のエッジは保存され, 高精度な復元画像が得られる., 一般社団法人電子情報通信学会, 日本語
  • 画像復元のための雑音位置検出手法に関する一考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 101, 204, 131, 136, 2001年07月11日
    インパルス性雑音により劣化した画像の復元手法として, インパルス性雑音検知とフィルタ処理から構成されるPSMフィルタが提案されている.しかし, PSMフィルタのインパルス性雑音検知は, 雑音の階調値と類似した信号値により構成された細部においてインパルス性雑音を検出し残したり, エッジなどの原信号画素をインパルス性雑音と誤検出する問題が生じる.そこで本文では, 高精度なインパルス性雑音の検出を目的とし, この後者の問題点を解決する手法を提案する.提案手法では, フィルタ窓の大きさが異なるメジアンフィルタを使用することにより, 従来法に比べエッジにおいて雑音の検知精度が向上し, 高精度な画像復元結果が得られる., 一般社団法人電子情報通信学会, 日本語
  • 動的輪郭モデルを用いた顔画像の抽出に関する考察
    米山 昇吾, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 101, 204, 137, 142, 2001年07月11日
    動的輪郭モデル(Snakes)を用いた輪郭抽出法が種々提案されている.その一つに形状を維持しながら輪郭抽出を行うSnakesがある.この手法はノイズの影響を受けにくいという長所を持つが, Snakesの内部に複数の物体が包含された場合, 目的の対象物を抽出することが困難である.そこで, 本稿では, 面積項を持つSnakesが凹形状の物体を抽出できるという性質を利用し, Snakesを分裂させ, 複数の物体を包含した場合にも目的の対象物を抽出可能な手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 線画像認識システムの構築に関する考察
    松村 篤志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 101, 202, 99, 104, 2001年07月11日
    本文では, 線画像の特徴を認識し, 所望の線画像に類似した画像をデータベース中から検出するための新たなシステムを提案する.提案手法では, 分割された複数の領域から円形度, 隠ぺい度などの特徴量を算出し, それらを用いて画像間の類似度を算出する.また, 強化学習を行うことにより, 画像を際だって特徴づける部分に重みづけを行い, 高精度な認識を実現する。本文では, 実験により提案手法の特徴量の有効性, および強化学習の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • 対応点決定法におけるGA及びSAを用いた探索手法の改善
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 101, 202, 119, 124, 2001年07月11日
    二枚の画像に存在する同一物体の対応付けを遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いて探索する手法が既に提案されている.しかしながら, 二枚の画像間で同一物体の大きさが異なる場合, 最適回を得るために複数回探索を行なう必要がある.本稿では, 従来法の探索アルゴリズムである遺伝的アルゴリズムを改良し, 一回の探索で従来の探索と同様の結果を得る手法を提案する.また, 実験を行ない, その有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • エッジ保存を考慮した適応カルマンフィルタによる画像復元法
    松村 淳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 101, 202, 125, 130, 2001年07月11日
    本文では, 画像の性質に適応したモデル化法を提案し, そのモデルから導出されるカルマンフィルタにより, 画像のエッジ保存及び効果的なノイズの平滑化を実現する.カルマンフィルタを用いて劣化画像より雑音除去を行う場合, ノイズの平滑化とともに画像の特徴的な構造であるエッジ部も同時に平滑化され, ぼけた復元画像が得られる.そこで本手法では, 画像を平坦部とエッジ部に分類し, それぞれに適した画像のモデルを推定することにより, 過剰な平滑化を避けた高精度な復元を可能とする.更に, それぞれのモデルから設計されるカルマンフィルタを画像の各部分に適応的に用い, 画像の細部に適した復元を実現する.この結果, 画像のエッジは保存され, 高精度な復元画像が得られる., 一般社団法人電子情報通信学会, 日本語
  • 画像復元のための雑音位置検出手法に関する一考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 101, 202, 131, 136, 2001年07月11日
    インパルス性雑音により劣化した画像の復元手法として, インパルス性雑音検知とフィルタ処理から構成されるPSMフィルタが提案されている.しかし, PSMフィルタのインパルス性雑音検知は, 雑音の階調値と類似した信号値により構成された細部においてインパルス性雑音を検出し残したり, エッジなどの原信号画素をインパルス性雑音と誤検出する問題が生じる.そこで本文では, 高精度なインパルス性雑音の検出を目的とし, この後者の問題点を解決する手法を提案する.提案手法では, フィルタ窓の大きさが異なるメジアンフィルタを使用することにより, 従来法に比べエッジにおいて雑音の検知精度が向上し, 高精度な画像復元結果が得られる., 一般社団法人電子情報通信学会, 日本語
  • 動的輪郭モデルを用いた顔画像の抽出に関する考察
    米山 昇吾, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 101, 202, 137, 142, 2001年07月11日
    動的輪郭モデル(Snakes)を用いた輪郭抽出法が種々提案されている.その一つに形状を維持しながら輪郭抽出を行うSnakesがある.この手法はノイズの影響を受けにくいという長所を持つが, Snakesの内部に複数の物体が包含された場合, 目的の対象物を抽出することが困難である.そこで, 本稿では, 面積項を持つSnakesが凹形状の物体を抽出できるという性質を利用し, Snakesを分裂させ, 複数の物体を包含した場合にも目的の対象物が抽出可能な手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 複比を用いた自動走行システムのための消失点推定
    数井 誠人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理, 84, 7, 1319, 1327, 2001年07月01日
    本論文では, 自動走行システムが直線路において車両の進行方向を決定するための消失点を推定する新たな手法を提案する. 本手法では一直線上の4点から計算される複比を用いて, 画像から消失点を形成するエッジを抽出する. その後, 抽出されたエッジに対して, 1点で交差する直線群をHough空間においてフィッティングさせることにより消失点を推定する. 従来の代表的な手法では, 道路構造やレーン形状の大域的な拘束条件を用いることにより, 安定した道路境界推定を可能としているが, 他車両によってレーンマーキングが隠ぺいされた状況における消失点の推定に問題が残っている. これに対し, 提案手法はレーンマーキングの位置や形状に関する拘束条件を用いないので, 抽出すべき道路上の特徴をレーンマーキングに限定する必要がなく, 路肩や背景のエッジを用いて消失点を推定することができる. したがって, 提案手法では, レーンマーキングの隠ぺい等が生じても限られたエッジから消失点を安定して推定できる. 一般道路を撮影した画像を用いた実験結果により提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • ICUにおけるカテーテル敗血症の発生状況についての検討 : 輸液ラインにクローズドシステムを使用して
    長谷山 雅美, 大槻 直子, 長谷山 美紀, 日本看護研究学会雑誌, 24, 3, 307, 307, 2001年06月27日
    日本語
  • CORDIC実現に適した確率勾配ラチスフィルタアルゴリズムの提案
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 101, 142, 25, 30, 2001年06月22日
    本文では,CORDICアルゴリズムによる実現に適した確率勾配ラチスフィルタアルゴリズムを提案する.提案手法は,反射係数ではなく回転角を直接時刻更新するため,CORDICプロセッサを用いた効率的なフィルタの実現が可能である.さらに,提案するフィルタアーキテクチャは,加算器とCORDICプロセッサからなる単純な構造を持つため,少ないハードウェア量で実現することができるという利点を持つ., 一般社団法人電子情報通信学会, 日本語
  • 動画像動き検出器のFPGA実現に関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 101, 142, 45, 50, 2001年06月22日
    動画像の高精度な動き検出を可能とする手法が提案されている.しかし,この動き検出法は,動画像内のブロックの3次元回転を考慮するため,多大な計算量が必要であるという問題がある.そこで,本文ではハードウェア化によりこの計算時間の問題を解決することを目的とし,この動き検出処理を効果的にハードウェア実現するアーキテクチャを提案する.さらに,本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計し,FPGAデバイス上に実現する.実現された動き検出器を用いて,実際の動画像の動き検出を行うことにより,その動作に問題がないことを確認する., 一般社団法人電子情報通信学会, 日本語
  • CORDIC実現に適した確率勾配ラチスフィルタアルゴリズムの提案
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 101, 146, 25, 30, 2001年06月22日
    本文では, CORDICアルゴリズムによる実現に適した確率勾配ラチスフィルタアルゴリズムを提案する. 提案手法は, 反射係数ではなく回転角を直接時刻更新するため, CORDICプロセッサを用いた効率的なフィルタの実現が可能である. さらに, 提案するフィルタアーキテクチャは, 加算器とCORDICプロセッサからなる単純な構造を持つため, 少ないハードウェア量で実現することができるという利点を持つ., 一般社団法人電子情報通信学会, 日本語
  • 動画像動き検出器のFPGA実現に関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 101, 146, 45, 50, 2001年06月22日
    動画像の高精度な動き検出を可能とする手法が提案されている. しかし, この動き検出法は, 動画像内のブロックの3次元回転を考慮するため, 多大な計算量が必要であるという問題がある. そこで, 本文ではハードウェア化によりこの計算時間の問題を解決することを目的とし, この動き検出処理を効果的にハードウェア実現するアーキテクチャを提案する. さらに, 本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計し, FPGAデバイス上に実現する. 実現された動き検出器を用いて, 実際の動画像の動き検出を行うことにより, その動作に問題がないことを確認する., 一般社団法人電子情報通信学会, 日本語
  • CORDIC実現に適した確率勾配ラチスフィルタアルゴリズムの提案
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 101, 144, 25, 30, 2001年06月22日
    本文では,CORDICアルゴリズムによる実現に適した確率勾配ラチスフイルタアルゴリズムを提案する.提案手法は,反射係数ではなく回転角を直接時刻更新するため,CORDICプロセッサを用いた効率的なフィルタの実現が可能である.さらに,提案するフィルタアーキテクチャは,加算器とCORDICプロセッサからなる単純な構造を持つため,少ないハードウエア量で実現することができるという利点を持つ., 一般社団法人電子情報通信学会, 日本語
  • 動画像動き検出器のFPGA実現に関する考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 101, 144, 45, 50, 2001年06月22日
    動画像の高精度な動き検出を可能とする手法が提案されている.しかし,この動き検出法は,動画像内のブロックの3次元回転を考慮するため,多大な計算量が必要であるという問題がある.そこで,本文ではハードウエア化によりこの計算時間の問題を解決することを目的とし,この動き検出処理を効果的にハードウエア実現するアーキテクチャを提案する.さらに,本文ではハードウェア記述言語の一つであるVHDLを用いてこのアーキテクチャを設計し,FPGAデバイス上に実現する.実現された動き検出器を用いて,実際の動画像の動き検出を行うことにより,その動作に問題がないことを確認する., 一般社団法人電子情報通信学会, 日本語
  • アフィン変換を利用した画像の著者認証法に関する一考察
    近藤 功, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 101, 141, 151, 156, 2001年06月21日
    ディジタル技術の発展に伴い,マルチメディアコンテンツの著作権保護が重要な課題となっている.そこで本稿では,画像の不正コピーを抑止するための一手法として,アフィン変換を利用した画像の著者認証法を提案する.提案手法では,電子透かし法とは異なり,画像に透かし情報の埋め込みを行わないため,画像の品質を維持できる特長を持つ.本稿で,数値実験により提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • アフィン変換を利用した画像の著者認証法に関する一考察
    近藤 功, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 101, 145, 151, 156, 2001年06月21日
    ディジタル技術の発展に伴い, マルチメディアコンテンツの著作権保護が重要な課題となっている. そこで本稿では, 画像の不正コピーを抑止するための一手法として, アフィン変換を利用した画像の著者認証法を提案する. 提案手法では, 電子透かし法とは異なり, 画像に透かし情報の埋め込みを行わないため, 画像の品質を維持できる特長を持つ. 本稿で, 数値実験により提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • アフィン変換を利用した画像の著者認証法に関する一考察
    近藤 功, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 101, 143, 151, 156, 2001年06月21日
    ディジタル技術の発展に伴り,マルチメディアコンテンツの著作権保護が重要な課題となっている.そこで本稿では,画像の不正コピーを抑止するためあ一手法として,アフイン変換を利用した画像の著者認証法を提案する.提案手法では,電子透かし法とは異なり,画像に透かし情報の埋め込みを行わないため,画像の品質を維持できる特長を持つ.本稿で,数値実験により提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 消失点推定に基づく曲線路におけるレーンマーキングの推定
    数井 誠人, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア = The journal of the Institute of Image Information and Television Engineers, 55, 6, 894, 897, 2001年06月20日
    本研究は, 自動走行システムが曲線路においてHough変換を用いてレーンマーキングを推定するための新たな手法について提案する.提案手法では, レーン形状を2次曲線で近似できる場合において, 消失点推定に基づきレーンパラメータを段階的に推定する.これにより, 曲線パラメータの推定にHough変換を用いる際の計算量を抑えることができる.計算機シミュレーションで関数フィッティングによる手法と比較を行い, 提案手法の有効性を示す., 一般社団法人映像情報メディア学会, 日本語
  • The estimation of curved lane markings based on the estimation of the vanishing point
    M. Kazui, M. Haseyama, H. Kitajima, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 55, 894, 2001年06月01日
  • An ARMA order selection method with fuzzy reasoning
    M Haseyama, H Kitajima, SIGNAL PROCESSING, 81, 6, 1331, 1335, 2001年06月
    A fuzzy reasoning based approach for ARMA order selection is discussed in this communication. The proposed method attempts to select the optimal ARMA order of a time-varying ARMA model. This method improves model validity-criterion based order selection, such as the Akaike's information criterion and the minimum description length, by applying a fuzzy recursive reasoning method and a fuzzy c-means clustering method. (C) 2001 Elsevier Science B.V. All rights reserved., ELSEVIER SCIENCE BV, 英語
  • A new fitness function of a genetic algorithm for routing applications
    J Inagaki, M Haseyama, H Kitajima, IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, E84D, 2, 277, 280, 2001年02月
    This paper presents a method of determining a fitness function in a genetic algorithm for routing the shortest route via several designated points. We can search for the optimum route efficiently by using the proposed fitness function and its validity is verified by applying it to the actual map data., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語, 速報,短報,研究ノート等(学術雑誌)
  • フラクタル次元を指標とした線画像の単純化
    上村 郷志, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 25, 8, 1, 6, 2001年01月30日
    特徴を保持した線画像の単純化手法について述べる.海岸線や雲などの自然形状は統計的自己相似性を持つことが知られており, その特徴量の1つであるフラクタル次元を指標とした単純化手法が既に提案されている.この手法では, 凹凸の大きさに基づいた特徴点抽出を行うことで, 大きく突出した部分を保持した単純化を実現している.しかしながら, 上記手法では, 画像解析において重要である突出部と曲線部の分類を行っていない.そこで, 本文では突出部と曲線部の分類を可能とする特徴解析手法を提案する.本提案手法を用いることで, より幅広い要求に応じた単純化を行うことが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • 非線形画像復元手法の提案とそのパラメータ決定に関する考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 25, 8, 7, 12, 2001年01月30日
    本文では, 高発生確率のインパルス性雑音によって劣化した画像の雑音除去が可能なメディアンフィルタを用いた非線形フィルタを提案する.提案手法は, 異なる大きさのフィルタ窓を持つメディアンフィルタを組み合わせ, さらにこのフィルタを繰り返し処理することにより効果的にインパルス性雑音を除去することが可能である.本文では, 実験により提案手法と他のメディアンフィルタに基づくフィルタと比較して, 提案手法が雑音除去性能において優れていることを確認する.さらに, 本文でフィルタ設計の際に設定すべきパラメータを決定する手法について検討する., 一般社団法人映像情報メディア学会, 日本語
  • 対象物体のスケールを考慮したGA及びSAによる対応点探索
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 25, 8, 13, 18, 2001年01月30日
    本文では, 異なった画像に存在する同一物体を対応付ける手法を提案する.対象物体を対応付ける手法として, 弾性輪郭モデルを用いた手法が既に提案されているが, 同一物体の大きさが異なる場合の対応付けには適用されていない.提案手法では, 従来法の探索アルゴリズムである遺伝的アルゴリズムの遺伝子型を改良し, 対象物体のスケールも考慮に入れた対応点探索を可能とする.また, 実験を行い, その有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • GAおよびSAを用いたフラクタル画像符号化に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 25, 8, 47, 52, 2001年01月30日
    フラクタル画像符号化におけるIFSパラメータの量子化誤差が, 再生画像に与える影響は大きい.従来法では, IFSパラメータの量子化誤差を最小とする量子化値を選択しているが, そのような量子化値が再生画像に与える影響を最小にし, 高品質な画像を再生するとは限らない.それゆえ, 高品質な再生画像を得るために, 高精度な量子化手法が必要とされている.そこで, 本文では, IFSパラメータをGAおよびSAを用いて高精度に量子化する新たな手法を提案する.本文で提案する手法を用いることにより, 高品質な画像を再生することが可能となる., 一般社団法人映像情報メディア学会, 日本語
  • フラクタル次元を指標とした線画像の単純化
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 100, 604, 1, 6, 2001年01月23日
    特徴を保持した線画像の単純化手法について述べる.海岸線や雲などの自然形状は統計的自己相似性を持つことが知られており, その特徴量の1つであるフラクタル次元を指標とした単純化手法が既に提案されている.この手法では, 凹凸の大きさに基づいた特徴点抽出を行うことで, 大きく突出した部分を保持した単純化を実現している.しかしながら, 上記手法では, 画像解析において重要である突出部と曲線部の分類を行っていない.そこで, 本文では突出部と曲線部の分類を可能とする特徴解析手法を提案する.本提案手法を用いることで, より幅広い要求に応じた単純化を行うことが可能となる., 一般社団法人電子情報通信学会, 日本語
  • 非線形画像復元手法の提案とそのパラメータ決定に関する考察
    近藤 啓子, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 100, 604, 7, 12, 2001年01月23日
    本文では, 高発生確率のインパルス性雑音によって劣化した画像の雑音除去が可能なメディアンフィルタを用いた非線形フィルタを提案する.提案手法は, 異なる大きさのフィルタ窓を持つメディアンフィルタを組み合わせ, さらにこのフィルタを繰り返し処理することにより効果的にインパルス性雑音を除去することが可能である.本文では, 実験により提案手法と他のメディアンフィルタに基づくフィルタと比較して, 提案手法が雑音除去性能において優れていることを確認する.さらに, 本文でフィルタ設計の際に設定すべきパラメータを決定する手法について検討する., 一般社団法人電子情報通信学会, 日本語
  • 対象物体のスケールを考慮したGA及びSAによる対応点探索
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 100, 604, 13, 18, 2001年01月23日
    本文では, 異なった画像に存在する同一物体を対応付ける手法を提案する.対象物体を対応付ける手法として, 弾性輪郭モデルを用いた手法が既に提案されているが, 同一物体の大きさが異なる場合の対応付けには適用されていない.提案手法では, 従来法の探索アルゴリズムである遺伝的アリゴリズムの遺伝子型を改良し, 対象物体のスケールも考慮に入れた対応点探索を可能とする.また, 実験を行い, その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • GAおよびSAを用いたフラクタル画像符号化に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 100, 604, 47, 52, 2001年01月23日
    フラクタル画像符号化におけるIFSパラメータの量子化誤差が, 再生画像に与える影響は大きい.従来法では, IFSパラメータの量子化誤差を最小とする量子化値を選択しているが, そのような量子化値が再生画像に与える影響を最小にし, 高品質な画像を再生するとは限らない.それゆえ, 高品質な再生画像を得るために, 高精度な量子化手法が必要とされている.そこで, 本文では, IFSパラメータをGAおよびSAを用いて高精度に量子化する新たな手法を提案する.本文で提案する手法を用いることにより, 高品質な画像を再生することが可能となる., 一般社団法人電子情報通信学会, 日本語
  • Hopfield neural networks for edge detection
    Y. Uchiyama, M. Haseyama, H. Kitajima, Proceedings - IEEE International Symposium on Circuits and Systems, 3, 608, 611, 2001年01月01日
    In this paper, new parameters of Hopfield Neural Network (HNN) for edge detection of image are proposed. In conventional methods, two kinds of edge parameters, which detect horizontal and vertical direction edges, are introduced. In the proposed method, other four kinds of edge parameters are introduced for more accurate edge detection., IEEE
  • A new genetic algorithm for routing the shortest route via several designated points
    Jun Inagaki, Miki Haseyama, Hideo Kitajima, ISCAS 2001 - 2001 IEEE International Symposium on Circuits and Systems, Conference Proceedings, 2, 217, 220, 2001年
    This paper presents a method of routing the shortest route via several designated points using a genetic algorithm and its effectiveness verified by applying the algorithm to map data. The proposed algorithm uses a fitness function which includes weight parameters based on the building block hypothesis. By using this function, the optimum is efficiently obtained. This kind of routing is difficult in the case of using existing methods such as Dijkstra's method. Also, the proposed method is more useful. © 2001 IEEE., IEEE, 英語
  • An implementation of a normalized ARMA lattice filter with a CORDIC algorithm
    S Shiraishi, M Haseyama, H Kitajima, ELECTRONICS AND COMMUNICATIONS IN JAPAN PART III-FUNDAMENTAL ELECTRONIC SCIENCE, 84, 4, 76, 86, 2001年
    In this paper we present a method of implementation of a normalized ARMA lattice filter using a CORDIC algorithm. Expansion of a previously proposed normalized AR lattice filter using the CORDIC algorithm for the purposes of its application to the normalized ARMA lattice filter is difficult due to problems related to the convergence magnitude of the rotation angle and the convergence speed. In this paper we demonstrate the possibility of overcoming the above-mentioned problems and of implementing a CORDIC ARMA lattice filter. Since the filter proposed in this work is implemented based on the CORDIC algorithm specifically adapted for the realization of the normalized ARMA lattice filter, it can be expected that it can be successively implemented in the form of a VLSI array. In addition, since such a filter performs the filtering by predicting the input signal, it can be used for the processing of unknown signals. This article also contains estimations of the effectiveness of the proposed method by experiments. (C) 2000 Scripta Technica., SCRIPTA TECHNICA-JOHN WILEY & SONS, 英語
  • Hough変換に基づく曲線路におけるレーンマーキングの推定に関する考察
    数井 誠人, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2000, 116, 85, 90, 2000年12月14日
    本研究では,運転支援システムが曲線路において走行可能領域を推定するための,Hough変換に基づくレーンマーキングの推定手法について提案する.提案手法では,レーン形状パラメータの直線成分を,複比を考慮した直線束を用いて推定する.また,変数変換後のエッジ座標から,レーン形状の曲率成分を角度ヒストグラムによって推定する.実際の道路画像に対して提案手法を適用し,走行レーン推定の安定性について検討する.This paper proposes a new method to estimate curved lane markings for vheicle steering. The proposed method is decomposed into two steps. First, it estimates the linear parameters of curved lane markings, then it fits lines that intersect at one point to the edges in a Hough space using cross ratio. Second, an angle histogram based on the Hough transform is used to estimate the curvature of the lane markings. We study the stability of the proposed method from experimental results using images of a real road scene., 一般社団法人情報処理学会, 日本語
  • スペックルの非定常性を考慮したSAR画像のノイズ低減に関する考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2000, 116, 91, 96, 2000年12月14日
    合成開口レーダ(SAR)画像中にはスペックル雑音が含まれており,これまでに様々なスペックル低減のためのフィルタが提案されている.一般にスペックルはその強度が指数分布に従う乗法性ノイズとされるが,SAR画像中の都市領域等においては成り立たないことが指摘されている.本文では,SAR画像中の領域をテクスチャにより分類し,各領域毎に適したカルマンフィルタを用いることによる効果的なノイズ低減手法を提案する.Synthetic aperture radar(SAR) images are affected by speckle noise, and numerous methods have been proposed for reducting the noise. Speckle is assumed to have the characteristics of a random multiplicative noise whose intensity obeys a negative exponential distribution, but these characteristics are not true on some scenes, such as urban areas, in the image. In this paper, we propose a Kalman filter adapted to the regions which are classified according to texture in the SAR images., 一般社団法人情報処理学会, 日本語
  • 専用コードブックと汎用コードブックの組み合わせによる画像のベクトル量子化
    夏井 知義, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2000, 116, 97, 102, 2000年12月14日
    本文では,静止画像を効率的に符号化するベクトル量子化器のための,代表ベクトルの生成方法を提案する.従来用いられているコードブックは,多数の学習画像をクラスタリングして生成される.しかし,高品質な再生画像を得るために,大量の代表ベクトルがコードブックに登録されるため,代表ベクトルのインデックスが長くなってしまう.この問題を解決するために,従来手法はインデックスを効率的に符号化する.提案手法は別のアプローチとして,画像のエッジ部と平坦部にそれぞれ適合するような2種類のコードブックを用いて,代表ベクトルの数を削減する.提案手法は,原画像から得る代表ベクトルをフィルタリングして生成される専用コードブックと,疑似乱数を用いて生成される汎用コードブックを使用する.提案手法の符号化効率が,インデックスを効率的に符号化することなしで,従来手法のそれと同等であることを示す.A method of generating the representative vectors for encoding still images efficiently using a vector quantizer, is proposed in this paper. A conventional codebook is generated by clustering many training images. But, many representative vectors are registered in the codebook for obtaining the high quality reconstructed image, thus the index of the representative vector becomes long. To solve this problem, the conventional methods encode the index efficiently. The proposed method is another approach for reducing the number of representative vectors by using two codebooks adapted to edges and flat regions of the image respectively. It uses a specific codebook which is generated by filtering the representative vectors from the source image, and a universal codebook which is generated by using random numbers. It is shown that the coding efficiency of the proposed method is comparable to the conventional methods without encoding the index efficiently., 一般社団法人情報処理学会, 日本語
  • カルマンフィルタによる高精度画像復元のためのパラメータ推定に関する考察
    松村 淳, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2000, 116, 103, 108, 2000年12月14日
    本文では,高精度な画像復元を目的としたカルマンフィルタのためのパラメータ推定法を提案する.カルマンフィルタを用いた画像復元の精度は,画像のモデル及び観測雑音の分散といったパラメータの推定精度に大きく左右される.従来のパラメータ推定法では,画像全体からパラメータを推定しており,画像の局所的な統計量の変化を考慮していない.このため,画像の細部にわたって高精度な復元が行われないという問題が生じる.提案手法は,画像の局所的な統計量の変化に注目し,画像の各部分の特徴に適応したパラメータ推定を行うことにより,高精度な画像復元を可能とする.また,シミュレーションを行い,その有効性を確認する.In this paper, we propose an estimation method of the parameters for accurate image restoration using a Kalman filter. If it is possible to estimate the parameters (i. e. an image model and a noise variance) with high accuracy, then an image can be restored accurately using a Kalman filter. In traditional parameter estimation methods, parameters are estimated from the whole image, and a change of the local statistics in an image is not considered. Therefore, detail and whole regions of the image are not restored accurately with the previous methods. The proposed method estimates parameters adapted to every part of image according to a change in the local statistics, and can thus restore an image more accurately. We have verified the validity of proposed method by several experiments., 一般社団法人情報処理学会, 日本語
  • 評価関数の改良によるGA及びSAを用いた対応点決定法の高精度化
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 2000, 116, 109, 114, 2000年12月14日
    二枚の画像から抽出された特徴点が与えられた場合,それらの対応付けを遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いて探索する手法が既に提案されている.しかしながら,従来法では,最適解と近い評価を得る局所解が存在するため,局所解に陥りやすいという問題がある.本稿では,従来法の評価関数を改善することにより局所解に陥る確率を減少させ,効率的に最適な対応付けを探索する手法を提案する.The authors have proposed a method which determines the correspondence of feature points in two different images by using a genetic algorithm and simulated annealing. Our previous method may get caught in a local minimum. The proposed method enables serching for suitable correspondence by an improvement of the fitness function., 一般社団法人情報処理学会, 日本語
  • Hough変換に基づく曲線路におけるレーンマーキングの推定に関する考察
    数井 誠人, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 78, 85, 90, 2000年12月14日
    本研究では, 運転支援システムが曲線路において走行可能領域を推定するための, Hough変換に基づくレーンマーキングの推定手法について提案する.提案手法では, レーン形状パラメータの直線成分を, 複比を考慮した直線束を用いて推定する.また, 変数変換後のエッジ座標から, レーン形状の曲率成分を角度ヒストグラムによって推定する.実際の道路画像に対して提案手法を適用し, 走行レーン推定の安定性について検討する., 一般社団法人映像情報メディア学会, 日本語
  • スペックルの非定常性を考慮したSAR画像のノイズ低減に関する考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 78, 91, 96, 2000年12月14日
    合成開口レーダ(SAR)画像中にはスペックル雑音が含まれており, これまでに様々なスペックル低減のためのフィルタが提案されている.一般にスペックルはその強度が指数分布に従う乗法性ノイズとされるが, SAR画像中の都市領域等においては成り立たないことが指摘されている.本文では, SAR画像中の領域をテクスチャにより分類し, 各領域毎に適したカルマンフィルタを用いることによる効果的なノイズ低減手法を提案する., 一般社団法人映像情報メディア学会, 日本語
  • 専用コードブックと汎用コードブックの組み合わせによる画像のペクトル量子化
    夏井 知義, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 78, 97, 102, 2000年12月14日
    本文では, 静止画像を効率的に符号化するベクトル量子化器のための, 代表ベクトルの生成方法を提案する.従来用いられているコードブックは, 多数の学習画像をクラスタリングして生成される.しかし, 高品質な再生画像を得るために, 大量の代表ベクトルがコードブックに登録されるため, 代表ベクトルのインデックスが長くなってしまう.この問題を解決するために, 従来手法はインデックスを効率的に符号化する.提案手法は別のアプローチとして, 画像のエッジ部と平坦部にそれぞれ適合するような2種類のコードブックを用いて, 代表ベクトルの数を削減する.提案手法は, 原画像から得る代表ベクトルをフィルタリングして生成される専用コードブックと, 疑似乱数を用いて生成される汎用コードブックを使用する.提案手法の符号化効率が, インデックスを効率的に符号化することなしで, 従来手法のそれと同等であることを示す., 一般社団法人映像情報メディア学会, 日本語
  • カルマンフィルタによる高精度画像復元のためのパラメータ推定に関する考察
    松村 淳, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 78, 103, 108, 2000年12月14日
    本文では, 高精度な画像復元を目的としたカルマンフィルタのためのパラメータ推定法を提案する.カルマンフィルタを用いた画像復元の精度は, 画像のモデル及び観測雑音の分散といったパラメータの推定精度に大きく左右される.従来のパラメータ推定法では, 画像全体からパラメータを推定しており, 画像の局所的な統計量の変化を考慮していない.このため, 画像の細部にわたって高精度な復元が行われないという問題が生じる.提案手法は, 画像の局所的な統計量の変化に注目し, 画像の各部分の特徴に適応したパラメータ推定を行うことにより, 高精度な画像復元を可能とする.また, シミュレーションを行い, その有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • 評価関数の改良によるGA及びSAを用いた対応点決定法の高精度化
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 78, 109, 114, 2000年12月14日
    二枚の画像から抽出された特徴点が与えられた場合, それらの対応付けを遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いて探索する手法が既に提案されている.しかしながら, 従来法では, 最適解と近い評価を得る局所解が存在するため, 局所解に陥りやすいという問題がある.本稿では, 従来法の評価関数を改善することにより局所解に陥る確率を減少させ, 効率的に最適な対応付けを探索する手法を提案する., 一般社団法人映像情報メディア学会, 日本語
  • Hough 変換に基づく曲線路におけるレーンマーキングの推定に関する考察
    数井 誠人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 100, 501, 85, 90, 2000年12月07日
    本研究では, 運転支援システムが曲線路において走行可能領域を推定するための, Hough変換に基づくレーンマーキングの推定手法について提案する.提案手法では, レーン形状パラメータの直線成分を, 複比を考察した直線束を用いて推定する.また, 変数変換後のエッジ座標から, レーン形状の曲率成分を角度ヒストグラムによって推定する.実際の道路画像に対して提案手法を適用し, 走行レーン推定の安定性について検討する., 一般社団法人電子情報通信学会, 日本語
  • スペックルの非定常性を考慮したSAR画像のノイズ低減に関する考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 100, 501, 91, 96, 2000年12月07日
    合成開口レーダ(SAR)画像中にはスペックル雑音が含まれており, これまでに様々なスペックル低減のためのフィルタが提案されている.一般にスペックルはその強度が指数分布に従う乗法性ノイズとされるが, SAR画像中の都市領域等においては成り立たないことが指摘されている.本文では, SAR画像中の領域をテクスチャにより分類し, 各領域毎に適したカルマンフィルタを用いることによる効果的なノイズ低減手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 専用コードブックと汎用コードブックの組み合わせによる画像のベクトル量子化
    夏井 知義, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 100, 501, 97, 102, 2000年12月07日
    本文では, 静止画像を効果的に符号化するベクトル量子化器のための, 代表ベクトルの生成方法を提案する.従来用iられているコードブックは, 多数の学習画像をクラスタリングして生成される.しかし, 高品質な再生画像を得るために, 大量の代表ベクトルがコードブックに登録されるため, 代表ベクトルのインデックスが長くなってしまう.この問題を解決するために, 従来手法はインデックスを効率的に符号化する.提案手法は別のアプローチとして, 画像のエッジ部と平坦部にそれぞれ適合するような2種類のコードブックを用いて, 代表ベクトルの数を削減する.提案手法は, 原画像から得る代表ベクトルをフィルタリングして生成される専用コードブックと, 疑似乱数を用いて生成される汎用コードブックを使用する.提案手法の符号化効率が, インデックスを効率的に符号化することなしで, 従来手法のそれと同等であることを示す., 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタによる高精度画像復元のためのパラメータ推定に関する考察
    松村 淳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 100, 501, 103, 108, 2000年12月07日
    本文では, 高精度な画像復元を目的としたカルマンフィルタのためのパラメータ推定法を提案する.カルマンフィルタを用いた画像復元の精度は, 画像のモデル及び観測雑音の分散といったパラメータの推定精度に大きく左右される.従来のパラメータ推定法では, 画像全体からパラメータを推定しており, 画像の局所的な統計量の変化を考慮していない.このため, 画像の細部にわたって高精度な復元が行われないという問題が生じる.提案手法は, 画像の局所的な統計量の変化に注目し, 画像の各部分の特長に適応したパラメータ推定を行うことにより, 高精度な画像復元を可能とする.また, シミュレーションを行い, その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 評価関数の改良によるGA及びSAを用いた対応点決定法の高精度化
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 100, 501, 109, 114, 2000年12月07日
    二枚の画像から抽出された特徴点が与えられた場合, それらの対応付けを遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いて探索する手法が既に提案されている.しかしながら, 従来訪では, 最適解と近い評価を得る局所解が存在するため, 局所解に陥りやすいという問題がある.本稿では, 従来訪の評価関数を改善することにより局所解に陥る確率を減少させ, 効率的に最適な対応付けを探索する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • Hough 変換に基づく曲線路におけるレーンマーキングの推定に関する考察
    数井 誠人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 499, 85, 90, 2000年12月07日
    本研究では, 運転支援システムが曲線路において走行可能領域を推定するための, Hough変換に基づくレーンマーキングの推定手法について提案する.提案手法では, レーン形状パラメータの直線成分を, 複比を考慮した直線束を用いて推定する.また, 変数変換後のエッジ座標から, レーン形状の曲率成分を角度ヒストグラムによって推定する.実際の道路画像に対して提案手法を適用し, 走行レーン推定の安定性について検討する., 一般社団法人電子情報通信学会, 日本語
  • スペックルの非定常性を考慮したSAR画像のノイズ低減に関する考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 499, 91, 96, 2000年12月07日
    合成開口レーダ(SAR)画像中にはスペックル雑音が含まれており, これまでに様々なスペックル低減のためのフィルタが提案されている.一般にスペックルはその強度が指数分布に従う乗法性ノイズとされるが, SAR画像中の都市領域等においては成り立たないことが指摘されている.本文では, SAR画像中の領域をテクスチャにより分類し, 各領域毎に適したカルマンフィルタを用いることによる効果的なノイズ低減手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 専用コードブックと汎用コードブックの組み合わせによる画像のベクトル量子化
    夏井 知義, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 499, 97, 102, 2000年12月07日
    本文では, 静止画像を効率的に符号化するベクトル量子化器のための, 代表ベクトルの生成方法を提案する.従来用いられているコードブックは, 多数の学習画像をクラスタリングして生成される.しかし, 高品質な再成画像を得るために, 大量の代表ベクトルがコードブックに登録されるため, 代表ベクトルのインデックスが長くなってしまう.この問題を解決するために, 従来手法はインデックスを効率的に符号化する.提案手法は別のアプローチとして, 画像のエッジ部と平坦部にそれぞれ適合するような2種類のコードブックを用いて, 代表ベクトルの数を削減する.提案手法は, 原画像から得る代表ベクトルをフィルタリングして生成される専用コードブックと, 擬似乱数を用いて生成される汎用コードブックを使用する.提案手法の符号化効率が, インデックスを効率的に符号化することなしで, 従来手法のそれと同等であることを示す., 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタによる高精度画像復元のためのパラメータ推定に関する考察
    松村 淳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 499, 103, 108, 2000年12月07日
    本文では, 高精度な画像復元を目的としたカルマンフィルタのためのパラメータ推定法を提案する.カルマンフィルタを用いた画像復元の精度は, 画像のモデル及び観測雑音の分散といったパラメータの推定精度に大きく左右される.従来のパラメータ推定法では, 画像全体からパラメータを推定しており, 画像の局所的な統計量の変化を考慮していない.このため, 画像の細部にわたって高精度な復元が行われないという問題が生じる.提案手法は, 画像の局所的な統計量の変化に注目し, 画像の各部分の特徴に適応したパラメータ推定を行うことにより, 高精度な画像復元を可能とする.また, シミュレーションを行い, その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 評価関数の改良によるGA及びSAを用いた対応点決定法の高精度化
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 100, 499, 109, 114, 2000年12月07日
    二枚の画像から抽出された特徴点が与えられた場合, それらの対応付けを遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いて探索する手法が既に提案されている.しかしながら, 従来法では, 最適解と近い評価を得る局所解が存在するため, 局所解に陥りやすいという問題がある.本稿では, 従来法の評価関数を改善することにより局所解に陥る確率を減少させ, 効率的に最適な対応付けを探索する手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • IFS optimization using discrete parameter pools
    Hiroyuki Honda, Miki Haseyama, Hideo Kitajima, IEICE Transactions on Information and Systems, E83-D, 233, 241, 2000年12月01日
    This paper proposes an Iterated Function System (IFS) which can reduce effects of quantization errors of the IFS parameters. The proposed method skips conventional analog-parameter search and directly selects optimum IFS parameters from pools of discrete IFS parameters. In conventional IFS-based image coding the IFS parameters are quantized after their analog optimum values are determined. The image reconstructed from the quantized parameters is degraded with errors that are traced back to quantization errors amplified in the iterated mappings. The effectiveness of this new realistic approach is demonstrated by simulation results over the conventional method.
  • ハイクロソフト酸化水による口腔洗浄の効果
    長谷山 雅美, 川本 まゆ子, 畑山 宣子, 竹内 明子, 長谷山 美紀, 櫻井 繁子, 日本集中治療医学会雑誌 = Journal of the Japanese Society of Intensive Care Medicine, 7, 4, 387, 388, 2000年10月01日
    The Japanese Society of Intensive Care Medicine, 日本語
  • 音場実測データを利用したスピ-カ境界条件モデルの同定
    田村 正剛, 秋保 政一, 長谷山 美紀, 北島 秀夫, 日本音響学会研究発表会講演論文集, 2000, 2, 395, 396, 2000年09月01日
    日本語
  • 媒体の磁気クラスタ構造の2次元解析
    武隈 育子, 長谷山 美紀, 末岡 和久, 武笠 幸一, 日本応用磁気学会学術講演概要集 = Digest of ... annual conference on magnetics in Japan, 24, 11, 11, 2000年09月01日
    日本語
  • 弾性モデルを用いた対応点探索へのGA及びSAの応用
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 210, 1, 6, 2000年07月25日
    本文では, 二枚の画像から抽出された特徴点が与えられた場合, それらの対応付けを弾性輪郭モデルを用いて決定する手法を提案する.弾性輪郭モデルを用いて特徴点の対応を決定する手法は既に提案されているが, 画像から抽出された特徴点の数が増加した場合, また, 対象物体が画像間で大きく移動した場合, 従来法では多くの計算時間を要するという問題が生じ実用的ではない.そこで, 提案手法では, 特徴点の対応付けを探索するために遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いることにより, 最適な対応付けを効率良く探索することを可能にする., 一般社団法人電子情報通信学会, 日本語
  • 線セグメントの方向性を用いた高速直線抽出法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 210, 7, 12, 2000年07月25日
    本文では, ディジタル直線を構成する線セグメントを利用する高速直線抽出法について述べる.アナログ直線は離散画像では整数値に離散化されたディジタル直線になる.このようなディジタル直線は線セグメントの連結で表せる.その際に, 与えられるアナログ直線の傾き範囲によって線セグメントの方向が異なることに着目する.各々の線セグメントの4方向に対応するアナログ直線の傾き範囲中で, 線セグメントの追跡により高速化を図る.本文では提案手法と従来手法であるHoguh変換との比較実験を行った結果により提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • ベクトルトレーサ法を用いた線画像の単純化に関する一考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 210, 13, 18, 2000年07月25日
    本文では, 自然形状の持つ統計的自己相似性に注目し, その特微量の1つであるフラクタル次元を単純化の指標とした, 新たな単純化法を提案する.提案手法では, フラクタル次元と関連深い, 原画像の凹凸状態を解析し, その結果に基づいて特徴点抽出を行うため, 輪郭形状を保持した単純化が可能である., 一般社団法人電子情報通信学会, 日本語
  • 低ビットレート動画像符号化のための動きベクトルの選択法に関する考察
    夏井 知義, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 210, 19, 24, 2000年07月25日
    本文は, 低ビットレート動画像符号化を実現するため, ブロックマッチングにおける動きベクトルの選択法に関する独自の手法を提案する.ブロックマッチングの平行移動モデルを解析することにより, 動きベクトルの選択法に改良の余地があることを示す.提案手法は, 低ビットレートに寄与する動きベクトルを選択する.その性能を評価するため, 動画像の複数のフレームを符号化することにより, ビットレートと画質の平均値を算出する.ある動画像の場合には, 全体のビットレートを従来の手法の約3分の2に削減することができることをシミュレーションの結果は示す.提案手法は動きが小さく分散が小さい動画像に対して効果的である., 一般社団法人電子情報通信学会, 日本語
  • 動き検出器のVHDL設計に関する一考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 210, 25, 30, 2000年07月25日
    動画像の高精度な動き検出を可能とする手法が提案されている.しかし, この動き検出法は, 動画像内のブロックの3次元回転を考慮するため, 多大な計算量が必要である.そこで, 本文ではハードウェア化によりこの計算時間の問題を解決することを目的とし, この動き検出処理を効率的に実現するアーキテクチャを提案する.さらに, 本文ではードウェア記述言語の一つであるVHDLを用いてこれらの処理を実現し, シミュレーションにより動作検証を行う., 一般社団法人電子情報通信学会, 日本語
  • 弾性モデルを用いた対応点探索へのGA及びSAの応用
    鈴木 研二, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 212, 1, 6, 2000年07月25日
    本文では, 二枚の画像から抽出された特徴点が与えられた場合, それらの対応付けを弾性輪郭モデルを用いて決定する手法を提案する.弾性輪郭モデルを用いて特徴点の対応を決定する手法は既に提案されているが, 画像から抽出された特徴点の数が増加した場合, また, 対象物体が画像間で大きく移動した場合, 従来法では多くの計算時間を要するという問題が生じ実用的ではない.そこで, 提案手法では, 特徴点の対応付けを探索するために遺伝的アルゴリズム(GA:Genetic Algorithm)及び焼きなまし法(SA:Simulated Annealing)を用いることにより, 最適な対応付けを効率良く探索することを可能にする., 一般社団法人電子情報通信学会, 日本語
  • 線セグメントの方向性を用いた高速直線抽出法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 212, 7, 12, 2000年07月25日
    本文では, ディジタル直線を構成する線セグメントを利用する高速直線抽出法について述べる.アナログ直線は離散画像では整数値に離散化されたディジタル直線になる.このようなディジタル直線は線セグメントの連結で表せる.その際に, 与えられるアナログ直線の傾き範囲によって線セグメントの方向が異なることに着目する.各々の線セグメントの4方向に対応するアナログ直線の傾き範囲中で, 線セグメントの追跡により高速化を図る.本文では提案手法と従来手法であるHoguh変換との比較実験を行った結果により提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • ベクトルトレーサ法を用いた線画像の単純化に関する一考察
    上村 郷志, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 212, 13, 18, 2000年07月25日
    本文では, 自然形状の持つ統計的自己相似性に注目し, その特徴量の1つであるフラクタル次元を単純化の指標とした, 新たな単純化法を提案する.提案手法では, フラクタル次元と関連深い, 原画像の凹凸状態を解析し, その結果に基づいて特徴点抽出を行うため, 輪郭形状を保持した単純化が可能である., 一般社団法人電子情報通信学会, 日本語
  • 低ビットレート動画像符号化のための動きベクトルの選択法に関する考察
    夏井 知義, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 212, 19, 24, 2000年07月25日
    本文は, 低ビットレート動画像符号化を実現するため, ブロックマッチングにおける動きベクトルの選択法に関する独自の手法を提案する.ブロックマッチングの平行移動モデルを解析することにより, 動きベクトルの選択法に改良の余地があることを示す.提案手法は, 低ビットレートに寄与する動きベクトルを選択する.その性能を評価するため, 動画像の複数のフレームを符号化することにより, ビットレートと画質の平均値を算出する.ある動画像の場合には, 全体のビットレートを従来の手法の約3分の2に削減することができることをシミュレーションの結果は示す.提案手法は動きが小さく分散が小さい動画像に対して効果的である., 一般社団法人電子情報通信学会, 日本語
  • 動き検出器のVHDL設計に関する一考察
    仲川 和志, 白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 212, 25, 30, 2000年07月25日
    動画像の高精度な動き検出を可能とする手法が提案されている.しかし, この動き検出法は, 動画像内のブロックの3次元回転を考慮するため, 多大な計算量が必要である.そこで, 本文ではハードウェア化によりこの計算時間の問題を解決することを目的とし, この動き検出処理を効率的に実現するアーキテクチャを提案する.さらに, 本文ではードウェア記述言語の一つであるVHDLを用いてこれらの処理を実現し, シミュレーションにより動作検証を行う., 一般社団法人電子情報通信学会, 日本語
  • 二重回転CORDIC法を用いた規格化ARMAラチスフィルタの実現に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 209, 19, 24, 2000年07月24日
    CORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する手法が提案されている.しかし, この手法により実現されるCORDIC単位区間には, 小さな角の回転操作を実行できないという問題がある.そこで本文では, 二重回転CORDICアルゴリズムを用いることにより, この問題を解決した新たなCORDIC単位区間を実現する.提案するCORDIC単位区間を用いることで, 高精度なCORDIC ARMAラチスフィルタの実現が可能となる., 一般社団法人電子情報通信学会, 日本語
  • 画像の均一性に着目したSAR画像のノイズ低減に関する一考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 209, 79, 84, 2000年07月24日
    合成開口レーダ(SAR)画像中にはスペックル雑音が含まれており、これまでに様々なスペックル低減のためのフィルタが提案されている。スペックルの統計的な性質は光学的には明らかにされているが、この性質は実際の画像中の都市領域等においては成り立たないことが知られている。本文では、SAR画像を均一性に着眼した基準(the local coefficient of variation)に基づき分割したものを領域に分類し、この領域に応じたカルマンフィルタを用いることによる効果的なノイズ低減法を提案する。, 一般社団法人電子情報通信学会, 日本語
  • GA経路探索における収束速度の改善に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 100, 209, 85, 90, 2000年07月24日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.この手法は, 個体の持つ経由点数に基づいて制御される重みが導入された新たな評価関数を用いることにより, 従来法における初期集団の発生や交叉の処理において生じる致死遺伝子が保持していた有効なスキマタを消失させずに探索を行い, 計算量を削減している.本稿では, 評価関数の重みの制御手法を改良することにより, より効率的に最適解に収束させる手法を提案する.さらに, 初期集団の発生方法を改良することにより収束速度を改善し, その有効性を実験によって確認する., 一般社団法人電子情報通信学会, 日本語
  • 二重回転CORDIC法を用いた規格化ARMAラチスフィルタの実現に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 211, 19, 24, 2000年07月24日
    CORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する手法が提案されている.しかし, この手法により実現されるCORDIC単位区間には, 小さな角の回転操作を実行できないという問題がある.そこで本文では, 二重回転CORDICアルゴリズムを用いることにより, この問題を解決した新たなCORDIC単位区間を実現する.提案するCORDIC単位区間を用いることで, 高精度なCORDIC ARMAラチスフィルタの実現が可能となる., 一般社団法人電子情報通信学会, 日本語
  • 画像の均一性に着目したSAR画像のノイズ低減に関する一考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 211, 79, 84, 2000年07月24日
    合成開口レーダ(SAR)画像中にはスペックル雑音が含まれており、これまでに様々なスペックル低減のためのフィルタが提案されている。スペックルの統計的な性質は光学的には明らかにされているが、この性質は実際の画像中の都市領域等においては成り立たないことが知られている。本文では、SAR画像を均一性に着眼した基準(the local coefficient of variation)に基づき分割したものを領域に分類し、この領域に応じたカルマンフィルタを用いることによる効果的なノイズ低減法を提案する。, 一般社団法人電子情報通信学会, 日本語
  • GA経路探索における収束速度の改善に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 100, 211, 85, 90, 2000年07月24日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.この手法は, 個体の持つ経由点数に基づいて制御される重みが導入された新たな評価関数を用いることにより, 従来法における初期集団の発生や交叉の処理において生じる致死遺伝子が保持していた有効なスキマタを消失させずに探索を行い, 計算量を削減している.本稿では, 評価関数の重みの制御手法を改良することにより, より効率的に最適解に収束させる手法を提案する.さらに, 初期集団の発生方法を改良することにより収束速度を改善し, その有効性を実験によって確認する., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いた複数経由点を伴う経路探索法
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-1, 情報・システム 1-情報処理, 83, 5, 504, 507, 2000年05月25日
    本論文では, あらかじめ指定された複数の点の全部並びに一部を経由する最短経路を遺伝的アルゴリズムを用いて検索する手法を提案する.また実際の地図データに適用した実験を行うことにより, 提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いた磁気クラスタ構造の解析法
    武隈 育子, 長谷山 美紀, 末岡 和久, 武笠 幸一, 日本応用磁気学会誌, 24, 4, 303, 306, 2000年04月15日
    Magnetization fluctuation in the transition region is one of the important factors causing transition noise. The fluctuation is closely related to magnetic microstructures such as magnetic clusters, and it is therefore necessary to quantitatively analyze these clusters. This paper proposes an analysis method that can extract two-dimensional features of clusters. The proposed method is based on a genetic algorithm (GA), and investigates the distribution of the magnetic poles that exist at the boundaries of magnetic clusters. By considering the obtained distribution, we estimate the cluster size and confirm the validity of the proposed method., 公益社団法人日本磁気学会, 日本語
  • 有限要素法を用いた応答解析によるスピーカの音響放射モデル
    田村 正剛, 秋保 政一, 長谷山 美紀, 北島 秀夫, 日本音響学会研究発表会講演論文集, 2000, 1, 503, 504, 2000年03月01日
    日本語
  • MEFX LMSを用いた騒音制御装置の性能について
    秋保 政一, 長谷山 美紀, 北島 秀夫, 日本音響学会研究発表会講演論文集, 2000, 1, (87), (88), 2000年03月01日
    日本語
  • カルマンフィルタを用いたSAR画像のノイズ低減に関する一考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 611, 1, 6, 2000年02月04日
    本文では合成開口レーダ(SAR)画像中のノイズを低減するためのカルマンフィルタを提案する.これまでにSAR画像中のスペックルを低減する方法が数多く提案されている.SAR画像中には乗法性ノイズの性質を有するスペックルだけでなく, 受信機の熱雑音等の加法性ノイズが含まれている.ここでは, 乗法性および加法性ノイズを考慮したカルマンフィルタを用いた.テスト画像上の処理結果により乗法性および加法性ノイズの低減における提案手法の有効性が示された.また, この手法をSAR画像に適用した実験結果を示す., 一般社団法人電子情報通信学会, 日本語
  • 力学モデルに基づく車線および消失点の推定に関する検討
    数井 誠人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 611, 7, 12, 2000年02月04日
    近年、道路走行環境や屋内環境における自律走行システムや運転支援システムに関する研究が活発になっている。これらのシステムでは進行方向を決めるための消失点や走行可能領域を推定するための車線等の検出が重要な技術要素となる。本稿ではこの目的のために、力学モデルに基づいた車線および消失点の推定手法について提案する。これは1点で交差する任意位置の直線群を予め用意しておき、エッジポテンシャルによって働く力からこれらの直線群を移動させ、車線と消失点を推定する手法がある。実験結果により提案手法の有効性を示す。, 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタを用いたSAR画像のノイズ低減に関する一考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 99, 609, 1, 6, 2000年02月04日
    本文では合成開口レーダ(SAR)画像中のノイズを低減するためのカルマンフィルタを提案する.これまでにSAR画像中のスペックルを低減する方法が数多く提案されている.SAR画像中には乗法性ノイズの性質を有するスペックルだけでなく, 受信機の熱雑音等の加法性ノイズが含まれている.ここでは, 乗法性および加法性ノイズを考慮したカルマンフィルタを用いた.テスト画像上の処理結果により乗法性および加法性ノイズの低減における提案手法の有効性が示された.また, この手法をSAR画像に適用した実験結果を示す., 一般社団法人電子情報通信学会, 日本語
  • 力学モデルに基づく車線および消失点の推定に関する検討
    数井 誠人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 99, 609, 7, 12, 2000年02月04日
    近年、道路走行環境や屋内環境における自律走行システムや運転支援システムに関する研究が活発になっている。これらのシステムでは進行方向を決めるための消失点や走行可能領域を推定するための車線等の検出が重要な技術要素となる。本稿ではこの目的のために、力学モデルに基づいた車線および消失点の推定手法について提案する。これは1点で交差する任意位置の直線群を予め用意しておき、エッジポテンシャルによって働く力からこれらの直線群を移動させ、車線と消失点を推定する手法である。実験結果により提案手法の有効性を示す。, 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタを用いたSAR画像のノイズ低減に関する一考察
    土田 正芳, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 11, 1, 6, 2000年02月04日
    本文では合成開口レーダ(SAR)画像中のノイズを低減するためのカルマンフィルタを提案する.これまでにSAR画像中のスペックルを低減する方法が数多く提案されている.SAR画像中には乗法性ノイズの性質を有するスペックルだけでなく, 受信機の熱雑音等の加法性ノイズが含まれている.ここでは, 乗法性および加法性ノイズを考慮したカルマンフィルタを用いた.テスト画像上の処理結果により乗法性および加法性ノイズの低減における提案手法の有効性が示された.また, この手法をSAR画像に適用した実験結果を示す., 一般社団法人映像情報メディア学会, 日本語
  • 力学モデルに基づく車線および消失点の推定に関する検討
    数井 誠人, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 11, 7, 12, 2000年02月04日
    近年、道路走行環境や屋内環境における自律走行システムや運転支援システムに関する研究が活発になっている。これらのシステムでは進行方向を決めるための消失点や走行可能領域を推定するための車線等の検出が重要な技術要素となる。本稿ではこの目的のために、力学モデルに基づいた車線および消失点の推定手法について提案する。これは1点で交差する任意位置の直接群を予め用意しておき、エッジポテンシャルによって働く力からこれらの直線群を移動させ、車線と消失点を推定する手法である。実験結果により提案手法の有効性を示す。, 一般社団法人映像情報メディア学会, 日本語
  • コスト関数を用いたIFS符号化の相似領域探索法に関する考察
    鈴木 康夫, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 610, 1, 6, 2000年02月03日
    本文では, コスト関数を用いたIFS符号化法におけるドメインブロックの探索法に着目し, その探索法を変更することにより再生画像の画質改善をはかる手法を提案する.レンジブロックの空間分割において, 従来法では誤差による閾値処理を行なうのに対し, コスト関数を用いたIFS符号化では誤差と符号量を考慮するひずみレート・コスト関数を用いることで画質改善をはかる.一方, 我々は以前, ブロックの細分化前に, ドメインブロックにおける相似領域探索の範囲を広げることで画質改善を可能とする手法を提案した.そこで本提案手法では, この手法の利点をコスト関数を用いたIFS符号化法に適用することでさらなる画質改善を可能にする.実験により, 提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • フラクタルブロック符号化へのGAの適用に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 610, 7, 12, 2000年02月03日
    フラクタルブロック符号化において算出されるIFSパラメータを量子化する際, 最も近い量子化値に量子化しても高品質な再生画像が得られるとは限らない.それゆえ, 高品質な再生画像を得るためには, いかにしてIFSパラメータを量子化すべきかは重要な問題となる.そこで, 本文では, IFSパラメータをGAを用いて量子化する新たな手法を提案する.本文で提案する手法は, より短い時間で最適なIFSパラメータを決定し, 高品質な再生画像を与えることを可能とする., 一般社団法人電子情報通信学会, 日本語
  • フルフレームDCTを用いた静止画像符号化における画質改善
    季平 浩治, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 610, 19, 24, 2000年02月03日
    本文では, フルフルームDCTを用いた静止画像符号化の画質改善法を提案する.DCTを画像符号化に用いる時は, 小ブロックに分割してから各ブロックにDCTを用いる方法がよく取られる.しかし, 低ビットレート下でのブロック歪が問題である.一方, フルフレームDCTを用いた場合ブロック歪は存在しない.ところが, 量子化ノイズが画像全体に分布してしまい, 特に高周波成分の量子化ノイズの影響により, 画像の平坦部において量子化ノイズが目立つ特徴がある.本文は, 適応的な後処理でフィルタ処理を用いることによる画質改善法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 新しい円を抽出するアルゴリズム
    ゲイツ ジョン, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 610, 49, 54, 2000年02月03日
    この論文は高精度に実時間で円を抽出するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から完全な円と円形の円弧を抽出することできる。アルゴリズムが450MHzのペンティアムIIプロセッサでたくさんの256×256の8ビット画像を実験した。その実験の平均のフレームレートは一秒で69フレーム以上である。このアルゴリズムの高精度を証明するために実験の結果を示す。, 一般社団法人電子情報通信学会, 英語
  • コスト関数を用いたIFS符号化の相似領域探索法に関する考察
    鈴木 康夫, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 99, 608, 1, 6, 2000年02月03日
    本文では, コスト関数を用いたIFS符号化法におけるドメインブロックの探索法に着目し, その探索法を変更することにより再生画像の画質改善をはかる手法を提案する.レンジブロックの空間分割において, 従来法では誤差による閾値処理を行なうのに対し, コスト関数を用いたIFS符号化では誤差と符号量を考慮するひずみレート・コスト関数を用いることで画質改善をはかる.一方, 我々は以前, ブロックの細分化前に, ドメインブロックにおける相似領域探索の範囲を広げることで画質改善を可能とする手法を提案した.そこで本提案手法では, この手法の利点をコスト関数を用いたIFS符号化法に適用することでさらなる画質改善を可能にする.実験により, 提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • フラクタルブロック符号化へのGAの適用に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 99, 608, 7, 12, 2000年02月03日
    フラクタルブロック符号化において算出されるIFSパラメータを量子化する際, 最も近い量子化値に量子化しても高品質な再生画像が得られるとは限らない.それゆえ, 高品質な再生画像を得るためには, いかにしてIFSパラメータを量子化すべきかは重要な問題となる.そこで, 本文では, IFSパラメータをGAを用いて量子化する新たな手法を提案する.本文で提案する手法は, より短い時間で最適なIFSパラメータを決定し, 高品質な再生画像を与えることを可能とする., 一般社団法人電子情報通信学会, 日本語
  • フルフレームDCTを用いた静止画像符号化における画質改善
    季平 浩治, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 99, 608, 19, 24, 2000年02月03日
    本文では, フルフレームDCTを用いた静止画像符号化の画質改善法を提案する.DCTを画像符号化に用いる時は, 小ブロックに分割してから各ブロックにDCTを用いる方法がよく取られる.しかし, 低ビットレート下でのブロック歪が問題である.一方, フルフレームDCTを用いた場合ブロック歪は存在しない.ところが, 量子化ノイズが画像全体に分布してしまい, 特に高周波成分の量子化ノイズの影響により, 画像の平坦部において量子化ノイズが目立つ特徴がある.本文は, 適応的な後処理でフィルタ処理を用いることによる画質改善法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 新しい円を抽出するアルゴリズム
    ゲイツ ジョン, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 99, 608, 49, 54, 2000年02月03日
    この論文は高精度に実時間で円を抽出するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から完全な円と円形の円弧を抽出することができる。アルゴリズムが450MHzのペンティアムIIプロセッサでたくさんの256×256の8ビット画像を実験した。その実験の平均のフレームレートは一秒で69フレーム以上である。このアルゴリズムの高精度を証明するために実験の結果を示す。, 一般社団法人電子情報通信学会, 英語
  • コスト関数を用いたIFS符号化の相似領域探索法に関する考察
    鈴木 康夫, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 10, 1, 6, 2000年02月03日
    本文では, コスト関数を用いたIFS符号化法におけるドメインブロックの探索法に着目し, その探索法を変更することにより再生画像の画質改善をはかる手法を提案する.レンジブロックの空間分割において, 従来法では誤差による閾値処理を行なうのに対し, コスト関数を用いたIFS符号化では誤差と符合量を考慮するひずみレート・コスト関数を用いることで画質改善をはかる.一方, 我々は以前, ブロックの細分化前に, ドメインブロックにおける相似領域探索の範囲を広げることで画質改善を可能とする手法を提案した.そこで本提案手法では, この手法の利点をコスト関数を用いたIFS符号化法に適用することでさらなる画質改善を可能にする.実験により, 提案手法の有効性を示す., 一般社団法人映像情報メディア学会, 日本語
  • フラクタルブロック符号化へのGAの適用に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 10, 7, 12, 2000年02月03日
    フラクタルブロック符号化において算出されるIFSパラメータを量子化する際, 最も近い量子化値に量子化しても高品質な再生画像が得られるとは限らない.それゆえ, 高品質な再生画像を得るためには, いかにしてIFSパラメータを量子化すべきかは重要な問題となる.そこで, 本文では, IFSパラメータをGAを用いて量子化する新たな手法を提案する.本文で提案する手法は, より短い時間で最適なIFSパラメータを決定し, 高品質な再生画像を与えることを可能とする., 一般社団法人映像情報メディア学会, 日本語
  • フルフレームDCTを用いた静止画像符号化における画質改善
    季平 浩治, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 10, 19, 24, 2000年02月03日
    本文では, フルフレームDCTを用いた静止画像符号化の画質改善法を提案する.DCTを画像符号化に用いる時は, 小ブロックに分割してから各ブロックにDCTを用いる方法がよく取られる.しかし, 低ビットレート下でのブロック歪が問題である.一方, フルフレームDCTを用いた場合ブロック歪は存在しない.ところが, 量子化ノイズが画像全体に分布してしまい, 特に高周波成分の量子化ノイズの影響により, 画像の平坦部において量子化ノイズが目立つ特徴がある.本文は, 適応的な後処理でフィルタ処理を用いることによる画質改善法を提案する., 一般社団法人映像情報メディア学会, 日本語
  • 新しい円を抽出するアルゴリズム
    ゲイツ ジョン, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 24, 10, 49, 54, 2000年02月03日
    この論文は高精度に実時間で円を抽出するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から完全な円と円形の円弧を抽出することができる。アルゴリズムが450MHzのペンティアムIIプロセッサでたくさんの256×256の8ビット画像を実験した。その実験の平均のフレームレートは一秒で69フレーム以上である。このアルゴリズムの高精度を照明するために実験の結果を示す。, 一般社団法人映像情報メディア学会, 日本語
  • Performance improvements on MEFX-LMS based noise cancellation system in vehicle cabin
    M Akiho, M Tamura, M Haseyama, H Kitajima, ISCAS 2000: IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS - PROCEEDINGS, VOL IV, 4, 353, 356, 2000年
    Multiple Error Filtered X (MEFX) LMS (Least Mean Squares) based Booming noise or Engine noise cancellation system has been implemented to the automobile and the reciprocate engine airplane cabin to provide practical solutions to improve the annoying noisy environment. The noises are well known that they behave as resonance noise of the fuselage. A significant difference in noise level or power spectrum between control points is often observed. For the cabin noise cancellation system, all passenger areas are expected to be quiet. Because of the MEFX LMS algorithm minimizes the total squared power of the error signals, degradation of increase in the noise level is observed in certain situations. In this paper, we demonstrate such a behavior of the algorithm and propose a method to improve a practical performance of the system., IEEE, 英語
  • Real-time polygon extraction from complex images
    JW Gates, M Haseyama, H Kitajima, ISCAS 2000: IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS - PROCEEDINGS, VOL V, 5, 309, 312, 2000年
    This paper presents an algorithm that is capable of extracting polygons from complex digital images for real-time video-applications. The algorithm uses a high-accuracy, real-time (HART) line-feature extraction algorithm to extract the line segments from the digital image. Then these line segments are grouped into triangles and quadrilaterals using an efficient scanning method that can be easily extended to n-sided polygons. The algorithm can process both convex and concave polygons. Tears were performed on a variety of 256 x 256 grayscale synthetic and natural images and an average frame rate of 58 frames per second was achieved using a 450 MHz. Pentium II processor. Experiments show that the algorithm accurately extracts the polygons from complex images., IEEE, 英語
  • An IFS-based image restoration method for impulsive noise contamination
    M Haseyama, M Takezawa, H Honda, H Kitajima, ISCAS 2000: IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS - PROCEEDINGS, VOL IV, 4, 593, 596, 2000年
    This paper proposes an Iterated Function System (IFS) based image-restoration method. The proposed method can restore images corrupted by impulsive noise according to self-similarity represented by the IFS. Since the IFS is usually used for image coding, it has never been applied to image restoration; and it cannot be utilized for the image restoration as it is. In order to adapt the IFS for image restoration, this paper reforms the conventional criterion for the computation of the IFS parameters to suit for image restoration, and as preprocessing we apply a median filter to the contaminated images prior to computing the IFS parameters. Some simulation results are presented to demonstrate the effectiveness of this method., IEEE, 英語
  • Performance improvements on MEFX-LMS based noise cancellation system in vehicle cabin
    M Akiho, M Tamura, M Haseyama, H Kitajima, ISCAS 2000: IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS - PROCEEDINGS, VOL IV, 4, 353, 356, 2000年
    Multiple Error Filtered X (MEFX) LMS (Least Mean Squares) based Booming noise or Engine noise cancellation system has been implemented to the automobile and the reciprocate engine airplane cabin to provide practical solutions to improve the annoying noisy environment. The noises are well known that they behave as resonance noise of the fuselage. A significant difference in noise level or power spectrum between control points is often observed. For the cabin noise cancellation system, all passenger areas are expected to be quiet. Because of the MEFX LMS algorithm minimizes the total squared power of the error signals, degradation of increase in the noise level is observed in certain situations. In this paper, we demonstrate such a behavior of the algorithm and propose a method to improve a practical performance of the system., IEEE, 英語
  • A highly accurate pipelined architecture for a CORDIC ARMA lattice filter
    S Shiraishi, M Haseyama, H Kitajima, ISCAS 2000: IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS - PROCEEDINGS, VOL V, 5, 369, 372, 2000年
    This paper presents a method to improve implementation accuracy of a recently proposed CORDIC ARMA lattice filter. Since the CORDIC ARMA lattice filter algorithm has a problem in its shift sequence, it cannot implement a lattice filter accurately. Therefore, in this paper we apply the shift sequence proposed by Walther without the problem to the CORDIC ARMA lattice filter, and then we realize an accurate lattice filter. In addition, we propose a new pipelined architecture for the CORDIC ARMA lattice filter. The proposed lattice filter architecture consists of CORDIC processors implemented in the pipelined fashion, it can achieve a high data processing throughput rate., IEEE, 英語
  • An image restoration method using IFS
    M Haseyama, M Takezawa, K Kondo, H Kitajima, 2000 INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, VOL III, PROCEEDINGS, 3, 774, 777, 2000年
    This paper proposes a new image-restoration method based on Iterated Function System (IFS). The proposed method can restore images contaminated by impulsive noise according to self-similarity represented by the IFS parameters. Since the IFS is usually used for image coding, it has never been applied to image restoration; and it cannot be utilized for image restoration as it is. In order to adapt the IFS for image restoration, this paper reforms the conventional criterion for the computation of the IFS parameters to suit for image restoration, and as preprocessing we apply an E-filter in which a median filter is embedded to contaminated images prior to computing the IFS parameters. Some simulation results are presented to demonstrate the effectiveness of this method., IEEE, 英語
  • 動的輪郭モデルパラメータの設定について
    鐘 文, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 1, 6, 1999年12月16日
    動的輪郭モデルは輪郭抽出の有効な手法である。この手法においては、試行誤差によって適当なパラメータを設定する必要があり、これが具体的応用への障害である。本論文では、強化学習を用いて輪郭モデルパラメータを設定する方法を提案する。本提案方式においては既存の強化学習手法の流れを修正して、ロバストではないという欠点を改善する。また、ヒューリスティックルールを加えて、探索時間を従来法より大幅に減少させる。動的輪郭モデルパラメータを設定する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人映像情報メディア学会, 英語
  • ディジタル直線を構成するセグメントの値に注目したHough変換の改善法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 43, 48, 1999年12月16日
    本論文は, ディジタル直線のHongh変換について述べる.以前提案した分割パラメータ空間による手法は, ディジタル直線のセグメントの方向性および大きさ(画素数)を用いてパラメータ空間に分割投票を行なうことより計算量の削減が実現できた.しかし, このような手法においてパラメータは整数の間隔に離散化されるため, すべてのディジタル直線に対して正しい累積値の検出が不可能である.これは, 特徴点が離散化された直線以外の直線に対しては満足させない.画素数によって決定される離散化された傾きと切片パラメータ値からなるパラメータ空間と任意の傾きと切片をもつディジタル直線の構成するセグメントの平均値とを用いる手法を提案する.提案手法を用いることによりディジタル直線の大きさ(画素数)と相当する累積値を得る実験結果から有効性が確認できる., 一般社団法人映像情報メディア学会, 日本語
  • 動的輪郭モデルパラメータの設定について
    鐘 文, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 99, 510, 1, 6, 1999年12月16日
    英語
  • ディジタル直線を構成するセグメントの値に注目した Hough 変換の改善法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 99, 510, 43, 48, 1999年12月16日
    本論文は, ディジタル直線のHongh変換について述べる.以前提案した分割パラメータ空間による手法は, ディジタル直線のセグメントの方向性および大きさ(画素数)を用いてパラメータ空間に分割投票を行なうことより計算量の削減が実現できた.しかし, このような手法においてパラメータは整数の間隔に離散化されるため, すべてのディジタル直線に対して正しい累積値の検出が不可能である.これは, 特徴点が離散化された直線以外の直線に対しては満足させない.画素数によって決定される離散化された傾きと切片パラメータ値からなるパラメータ空間と任意の傾きと切片をもつディジタル直線の構成するセグメントの平均値とを用いる手法を提案する.提案手法を用いることによりディジタル直線の大きさ(画素数)と相当する累積値を得る実験結果から有効性が確認できる., 一般社団法人映像情報メディア学会, 日本語
  • 画像復元 Hopfield NN における新しいエッジ抽出パラメータの導入
    内山 賢史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 99, 510, 61, 66, 1999年12月16日
    本発表では, 劣化画像復元のためのHopfield Neural Network(以下, HNN)において, 前処理として行うエッジ抽出HNNに関し, 従来法のエッジ抽出精度を向上するために新しいパラメータを導入する, 従来法では, HNNでエッジ抽出を行う際に, エッジの有無を判定するエッジパラメータを導入する.従来法では水平方向, 垂直方向の各画素に対してエッジの判定を行う2種類のパラメータを用意していたが, 新たに導入したパラメータは, 斜め方向の画素に対してエッジを判定する., 一般社団法人電子情報通信学会, 日本語
  • 実時間で多角形を抽出・分類するアルゴリズム
    ゲイツ ジョン, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 99, 510, 73, 78, 1999年12月16日
    この論文は高精度に実時間で多角形を抽出と分類するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から凸形、凹形両方の多角形を抽出することできる。このアルゴリズムは三角形を五つの種類に分類することできる。四辺形を六つの種類に分類することできる。アルゴリズムが450MHzのヘンティアムIIプロセッサでたくさんの256×256の8ビットを実験した。その実験の平均のフレーム率は一秒で69フレーム以上である。このアルゴリズムの高精度を証明するために実験の結果を示す。, 一般社団法人電子情報通信学会, 英語
  • 動的輪郭モデルパラメータの設定について
    鐘 文, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告. AVM,[オーディオビジュアル複合情報処理], 27, 1, 6, 1999年12月16日
    動的輪郭モデルは輪郭抽出の有効な手法である。この手法においては、試行誤差によって適当なパラメータを設定する必要があり、これが具体的応用への障害である。本論文では、強化学習を用いて輪郭モデルパラメータを設定する方法を提案する。本提案方式においては既存の強化学習手法の流れを修正して、ロバストではないという欠点を改善する。また、ヒューリスティックルールを加えて、探索時間を従来法より大幅に減少させる。動的輪郭モデルパラメータを設定する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人情報処理学会, 日本語
  • ディジタル直線を構成するセグメントの値に注目したHough変換の改善法
    金 義鎖, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 107, 43, 48, 1999年12月16日
    本論文は,ディジタル直線のHough変換について述べる.以前提案した分割パラメータ空間による手法は,ディジタル直線のセグメントの方向性および大きさ(画素数)を用いてパラメータ空間に分割投票を行なうことより計算量の削減が実現できた.しかし,このような手法においてパラメータは整数の間隔に離散化されるため,すべてのディジタル直線に対して正しい累積値の検出が不可能である.これは,特徴点が離散化された直線以外の直線に対しては満足させない.画素数によって決定される離散化された傾きと切片パラメータ値からなるパラメータ空間と任意の傾きと切片をもつディジタル直線の構成するセグメントの平均値とを用いる手法を提案する.提案手法を用いることによりディジタル直線の大きさ(画素数)と相当する累積値を得る実験結果から有効性が確認できる.We describe how to vote in the parameter space of the Hough transform in a digital image. It has been proven. that the calculation cost can be reduced by using the direction and length of the segments. However, the previous algorithm can not represent the value of the correct peaks in the parameter space because the parameter space was defined as a discrete intercept and slope interval. In this paper, we propose an algorithm that uses the association of the intercept and slope parameters and the length of the segments of the digital lines. We show by experimental results that the algorithm can detect the correct value of the peaks in the parameter space., 一般社団法人情報処理学会, 日本語
  • 画像復元Hopfield NNにおける新しいエッジ抽出パラメータの導入
    内山 腎史, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 107, 61, 66, 1999年12月16日
    本発表では,劣化画像復元のためのHopfield Neural Network(以下,HN)において,前処理として行うエッジ抽出HNNに関し,従来法のエッジ抽出精度を向上するために新しいパラメータを導入する.従来法では,HNNでエッジ抽出を行う際に,エッジの有無を判定するエッジパラメータを導入する.従来法では水平方向,垂直方向の各画素に対してエッジの判定を行う2種類のパラメータを用意していたが,新たに導入したパラメータは,斜め方向の画素に対してエッジを判定する.This paper proposes new parameters of a Hopfield Neural Network (HNN) for edge detection of images. The HNN has been used as a preprocessor of an image restoration HNN. Therefore, edge detection accuracy is closely related with the image restoration performance. The proposed new parameters can make the previous method detect edges more accurately., 一般社団法人情報処理学会, 日本語
  • マルチエージェントを用いた複数フレーム線分画像からの同一物体の抽出
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 107, 67, 72, 1999年12月16日
    本文では複数フレームの線分画像から,回転,変形,遮蔽を伴う同一閉曲線をマルチエージェントを用いて抽出する手法を提案する.既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている.中でも同一物体の輪郭線の判断が困難である線分画像に対して,輪郭線を線分に分割し,フレーム間で線分を対応づけ,同一物体と思われる線分を統合することで抽出を行なう手法が提案されている.しかし,フレーム間で線分を対応づける際にすべての組合せについて考慮しているため,画像中の線分数が増加すると対応づけに要する計算量が多くなるという問題があった.そこで本文では上記の対応の評価を効用関数とし,集団合理性に従うエージェントを導入することにより,先に述べた問題点を解決した.さらに線分が分岐している箇所での効用に注目することで,遮蔽の判断を行ない,線分が部分的に隠れている場合にも抽出を実現した.This paper presents a multi-agent based method to extract the same objects in image sequences. In the proposed method, the objects are divided into line segments which are considered to be agents. Further, the method is based on a multi-agent algorithm of which the utility function is defined with a motion continuity and a shape classification of line segments. By optimizing the utility, the proposed method searches for a suitable line segment which corresponds to the target segment in a different frame. According to the group rationality, the proposed method can correctly provide correspondence among line segments in different frames. Further, the computational cost can be reduced by utilizing the group rationality. The proposed method can also extract occluded objects by tracking utilities in multi frames., 一般社団法人情報処理学会, 日本語
  • 実時間で多角形を抽出・分類するアルゴリズム
    ジョンゲイツ, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 107, 73, 78, 1999年12月16日
    この論文は高精度に実時間で多角形を抽出と分類するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から凸形、凹形両方の多角形を抽出することできる。このアルゴリズムは三角形を五つの種類に分類することできる。四辺形を六つの種類に分類することできる。アルゴリズムが450MHzのペンティアムIIプロセッサでたくさんの256×256の8ビットを実験した。その実験の平均のフレーム率は一秒で69フレーム以上である。このアルゴリズムの高精度を証明するために実験の結果を示す。This paper presents a high-accuracy real-time polygon extraction and classification algorithm. The algorithm is capable of extracting both convex and concave polygons from complex images. The algorithm can classify triangles into five distinct classes and can classify quadrilaterals into six distinct classes. The algorithm was trsted with a variety of natural and synthetic 256×256 grayscale images and an average frame rate of more than 69 frames / second was obtained using a 450 MHz. Pentium II Processor. Experimental results are presented which demonstrate the high-accuracy of the algorithm., 一般社団法人情報処理学会, 日本語
  • 動的輪郭モデルパラメータの設定について
    鐘 文, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 512, 1, 6, 1999年12月16日
    動的輪郭モデルは輪郭抽出の有効な手法である。この手法においては、試行誤差によって適当なパラメータを設定する必要があり、これが具体的応用への障害である。本論文では、強化学習を用いて輪郭モデルパラメータを設定する方法を提案する。本提案方式においては既存の強化学習手法の流れを修正して、ロバストではないという欠点を改善する。また、ヒューリスティックルールを加えて、探索時間を従来法より大幅に減少させる。動的輪郭モデルパラメータを設定する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人電子情報通信学会, 英語
  • ディジタル直線を構成するセグメントの値に注目した Hough 変換の改善法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 512, 43, 48, 1999年12月16日
    本論文は,ディジタル直線のHough変換について述べる.以前提案した分割パラメータ空間による手法は,ディジタル直線のセグメントの方向性および大きさ(画素数)を用いてパラメータ空間に分割投票を行なうことより計算量の削減が実現できた.しかし,このような手法においてパラメータは整数の間隔に離散化されるため,すべてのディジタル直線に対して正しい累積値の検出が不可能である.これは,特徴点が離散化された直線以外の直線に対しては満足させない.画素数によって決定される離散化された傾きと切片パラメータ値からなるパラメータ空間と任意の傾きと切片をもつディジタル直線の構成するセグメントの平均値とを用いる手法を提案する.提案手法を用いることによりディジタル直線の大きさ(画素数)と相当する累積値を得る実験結果から有効性が確認できる., 一般社団法人電子情報通信学会, 日本語
  • 面像復元 Hopfield NN における新しいエッジ抽出パラメータの導入
    内山 賢史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 512, 61, 66, 1999年12月16日
    本発表では,劣化画像復元のためのHopfield Neural Network(以下,HNN)において,前処理として行うエッジ抽出HNNに関し,従来法のエッジ抽出精度を向上するために新しいパラメータを導入する.従来法では,HNNでエッジ抽出を行う際に,エッジの有無を判定するエッジパラメータを導入する.従来法では水平方向,垂直方向の各画素に対してエッジの判定を行う2種類のパラメータを用意していたが,新たに導入したパラメータは,斜め方向の画素に対してエッジを判定する., 一般社団法人電子情報通信学会, 日本語
  • マルチエージェントを用いた複数フレーム線分画像からの同一物体の抽出
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 512, 67, 72, 1999年12月16日
    本文では複数フレームの線分画像から,回転,変形,遮蔽を伴う同一閉曲線をマルチエージェントを用いて抽出する手法を提案する.既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている.中でも同一物体の輪郭線の判断が困難である線分画像に対して,輪郭線を線分に分割し,フレーム間で線分を対応づけ,同一物体と思われる線分を統合することで抽出を行なう手法が提案されている.しかし,フレーム間で線分を対応づける際にすべての組合せについて考慮しているため,画像中の線分数が増加すると対応づけに要する計算量が多くなるという問題があった.そこで本文では上記の対応の評価を効用関数とし,集団合理性に従うエージェントを導入することにより,先に述べた問題点を解決した.さらに線分が分岐している箇所での効用に注目することで,遮蔽の判断を行ない,線分が部分的に隠れている場合にも抽出を実現した., 一般社団法人電子情報通信学会, 日本語
  • 実時間で多角形を抽出・分類するアルゴリズム
    ゲイツ ジョン, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 512, 73, 78, 1999年12月16日
    この論文は高精度に実時間で多角形を抽出と分類するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から凸形、凹形両方の多角形を抽出することできる。このアルゴリズムは三角形を五つの種類に分類することできる。四辺形を六つの種類に分類することできる。アルゴリズムが450MHzのペンティアムIIプロセッサでたくさんの256×256の8ビットを実験した。その実験の平均のフレーム率は一秒で69フレーム以上である。このアルゴリズムの高精度を証明するために実験の結果を示す。, 一般社団法人電子情報通信学会, 英語
  • マルチエージェントを用いた複数フレーム線分画像からの同一物体の抽出
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 99, 510, 67, 72, 1999年12月16日
    本文では複数フレームの線分画像から,回転,変形,遮蔽を伴う同一閉曲線をマルチエージェントを用いて抽出する手法を提案する.既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている.中でも同一物体の輪郭線の判断が困難である線分画像に対して,輪郭線を線分に分割し,フレーム間で線分を対応づけ,同一物体と思われる線分を統合することで抽出を行なう手法が提案されている.しかし,フレーム間で線分を対応づける際にすべての組合せについて考慮しているため,画像中の線分数が増加すると対応づけに要する計算量が多くなるという問題があった.そこで本文では上記の対応の評価を効用関数とし,集団合理性に従うエージェントを導入することにより,先に述べた問題点を解決した.さらに線分が分岐している箇所での効用に注目することで,遮蔽の判断を行ない,線分が部分的に隠れている場合にも抽出を実現した., 一般社団法人電子情報通信学会, 日本語
  • 動的輪郭モデルパラメータの設定について
    鐘 文, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 1, 6, 1999年12月16日
    動的輪郭モデルは輪郭抽出の有効な手法である。この手法においては、試行誤差によって適当なパラメータを設定する必要があり、これが具体的応用への障害である。本論文では、強化学習を用いて輪郭モデルパラメータを設定する方法を提案する。本提案方式においては既存の強化学習手法の流れを修正して、ロバストではないという欠点を改善する。また、ヒューリスティックルールを加えて、探索時間を従来法より大幅に減少させる。動的輪郭モデルパラメータを設定する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人電子情報通信学会, 英語
  • ディジタル直線を構成するセグメントの値に注目したHough変換の改善法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 43, 48, 1999年12月16日
    本論文は,ディジタル直線のHough変換について述べる.以前提案した分割パラメータ空間による手法は,ディジタル直線のセグメントの方向性および大きさ(画素数)を用いてパラメータ空間に分割投票を行なうことより計算量の削減が実現できた.しかし,このような手法においてパラメータは整数の間隔に離散化されるため,すべてのディジタル直線に対して正しい累積値の検出が不可能である.これは,特徴点が離散化された直線以外の直線に対しては満足させない.画素数によって決定される離散化された傾きと切片パラメータ値からなるパラメータ空間と任意の傾きと切片をもつディジタル直線の構成するセグメントの平均値とを用いる手法を提案する.提案手法を用いることによりディジタル直線の大きさ(画素数)と相当する累積値を得る実験結果から有効性が確認できる., 一般社団法人電子情報通信学会, 日本語
  • 画像復元Hopfield NNにおける新しいエッジ抽出パラメータの導入
    内山 賢史, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 61, 66, 1999年12月16日
    本発表では,劣化画像復元のためのHopfield Neural Network(以下,HNN)において,前処理として行うエッジ抽出HNNに関し,従来法のエッジ抽出精度を向上するために新しいパラメータを導入する.従来法では,HNNでエッジ抽出を行う際に,エッジの有無を判定するエッジパラメータを導入する.従来法では水平方向,垂直方向の各画素に対してエッジの判定を行う2種類のパラメータを用意していたが,新たに導入したパラメータは,斜め方向の画素に対してエッジを判定する., 一般社団法人電子情報通信学会, 日本語
  • マルチエージェントを用いた 複数フレーム線分画像からの同一物体の抽出
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 67, 72, 1999年12月16日
    本文では複数フレームの線分画像から, 回転, 変形, 遮蔽を伴う同一閉曲線をマルチエージェントを用いて抽出する手法を提案する.既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている.中でも同一物体の輪郭線の判断が困難である線分画像に対して, 輪郭線を線分に分割し, フレーム間で線分を対応づけ, 同一物体と思われる線分を統合することで抽出を行なう手法が提案されている.しかし, フレーム間で線分を対応づける際にすべての組合せについて考慮しているため, 画像中の線分数が増加すると対応づけに要する計算量が多くなるという問題があった.そこで本文では上記の対応の評価を効用関数とし, 集団合理性に従うエージェントを導入することにより, 先に述べた問題点を解決した.さらに線分が分岐している箇所での効用に注目することで, 遮蔽の判断を行ない, 線分が部分的に隠れている場合にも抽出を実現した., 一般社団法人映像情報メディア学会, 日本語
  • 実時間で多角形を抽出・分類するアルゴリズム
    ゲイツ ジョン, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 79, 73, 78, 1999年12月16日
    この論文は高精度に実時間で多角形を抽出と分類するアルゴリズムを示す。このアルゴリズムは複雑な入力画像から凸形、凹形両方の多角形を抽出することできる。このアルゴリズムは三角形を五つの種類に分類することできる。四辺形を六つの種類に分類することできる。アルゴリズムが450MHzのペンティアムIIプロセッサでたくさんの256×256の8ビットを実験した。その実験の平均のフレーム率は一秒で69フレーム以上である。このアルゴリズムの高精度を証明するために実験の結果を示す。, 一般社団法人電子情報通信学会, 英語
  • 動的輪郭モデルパラメータの設定について
    鐘文, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 107, 1, 6, 1999年12月16日
    動的輪郭モデルは輪郭抽出の有効な手法である。この手法においては、試行誤差によって適当なパラメータを設定する必要があり、これが具体的応用への障害である。本論文では、強化学習を用いて輪郭モデルパラメータを設定する方法を提案する。本提案方式においては既存の強化学習手法の流れを修正して、ロバストではないという欠点を改善する。また、ヒューリスティックルールを加えて、探索時間を従来法より大幅に減少させる。動的輪郭モデルパラメータを設定する実験結果から、提案手法は従来法より有効であることを示す。Active contour models are effective in contour extraction. One difficulty with models the technologies is that much work is needed for reliable parameter acquisition, which is conventionally done by trial-and-error methods. This paper introduces reinforcement learning to determine parameters for specific applications. By modifying the learning stream, our system overcomes a drawback exisiting in the reinforcement learning method that it was not robust. Exploration time is shortened by adding heuristic rules. Experimental results show that our systems work effectively., 電子情報通信学会, 日本語
  • ディジタル直線を構成するセグメントの値に注目したHough変換の改善法
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 99, 510, 43, 48, 1999年12月16日
    電子情報通信学会, 日本語
  • 画像復元Hopfield NNにおける新しいエッジ抽出パラメータの導入
    内山 賢史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 99, 510, 61, 66, 1999年12月16日
    電子情報通信学会, 日本語
  • マルチエージェントを用いた複数フレーム線分画像からの同一物体の抽出
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 99, 510, 67, 72, 1999年12月16日
    電子情報通信学会, 日本語
  • 実時間で多角形を抽出・分類するアルゴリズム
    Gates John, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告, 99, 510, 73, 78, 1999年12月16日
    電子情報通信学会, 英語
  • Recurrent network model for range processing of the mustached bat
    Gang Wang, Miki Haseyama, Nobuo Suga, Proceedings of the International Joint Conference on Neural Networks, 1, 301, 304, 1999年12月01日
    A computational model, which simulates the neural processing of range information in the mustached bat is proposed. The internal states and the learning characteristics of the neural model as well as the mechanism for the processing of range information are explored. The neural model is capable of interpolation, so it can simulate the range information processing in bat's auditory system. The following important properties are found in the trained network: (1) five types of hidden units are created, and they have their counterparts in bat's brain based on the similarity of the response patterns; (2) the hidden units show characteristics of plasticity; and (3) a dis-inhibition mechanism is found, which has not yet been found in neurophysiological study., IEEE
  • Study of magnetization fluctuations in transition region using MFM image analysis
    I. Takekuma, M. Yasui, M. Haseyama, K. Sueoka, K. Mukasa, Digests of the Intermag Conference, 1999年12月01日
    Proposed is a quantitative analysis method to reveal the influence of the magnetization fluctuation on recorded states by processing MFM images. The proposed method processes the MFM images based on the concept of stochastic signals. The use of this concept can achieve to quantitatively analyze the magnetization fluctuation.
  • Fractal interpolation for natural images
    Hiroyuki Honda, Miki Haseyama, Hideo Kitajima, IEEE International Conference on Image Processing, 3, 657, 661, 1999年12月01日
    This paper proposes a fractal interpolation for natural images. Generally, linear interpolation and spline interpolation are used for image interpolation. However, an image interpolated by the above conventional methods lose some high-frequency components of an original image. The loss of components lower fidelity of the interpolated images. Since the proposed method reduces the loss, an interpolated image generated by the proposed method has higher fidelity than the one generated by the conventional method. The reduction of the loss is realized by using the fractional Brownian motion (FBM) in a process of the interpolation. The proposed method uses a characteristic that the fractal dimension is strongly correlated with a sense of roughness., IEEE
  • Genetic-algorithm based quantization method for fractal image coding
    Megumi Takezawa, Hiroyuki Honda, Jun Miura, Miki Haseyama, Hideo Kitajima, IEEE International Conference on Image Processing, 1, 458, 461, 1999年12月01日
    This paper proposes a high-accuracy quantization method for IFS parameters in fractal image coding by using a genetic algorithm (GA). The development of IFS-parameter quantization techniques is significant for the image coding because its errors make more serious problems in the iteration procedures than the other quantization topics. Even if the errors are small, high-quality reconstructed images are not necessarily obtained. Therefore, the high-accuracy quantization methods are required for the parameters. The proposed method provides higher quality reconstructed images than a conventional method which merely minimizes the errors., IEEE
  • MSEを評価関数に用いたGAによる画像領域分割法
    長谷山 美紀, 熊谷 正か輝, 宮本 俊洋, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理, 82, 11, 1903, 1911, 1999年11月25日
    遺伝的アルゴリズムを用いた領域分割手法を提案する.提案手法では,領域分割の精度を示す評価関数を領域内画素値を近似値で置き換えて得られる画像と元の画像との平均2乗誤差で定義する.その結果,領域分割は,要求される領域数のもとで評価関数を最小化する問題となる.この評価関数は,領域内近似式のパラメータだけでなく,分割領域の情報(領域形状とその位置)を用いて表現されており,従来の最適化手法では最小化が容易ではない.したがって,提案手法はGAを用いることにより,各領域に適した領域内画素の近似式を決定しながら,平均2乗誤差を最小にする領域分割結果の探索を可能とする.更に,提案手法では,マルコフ確率場モデルの導入によって,探索空間に存在する小領域のみが異なる複数の分割結果により局所解に陥るという問題を回避している.本論文の最後では提案手法の有効性を示すためにいくつかの実験結果を示す., 一般社団法人電子情報通信学会, 日本語
  • 遺伝子的アルゴリズムを用いた磁気クラスター解析
    武隅 育子, 長谷山 美紀, 末岡 和久, 武笠 幸一, 日本応用磁気学会学術講演概要集 = Digest of ... annual conference on magnetics in Japan, 23, 307, 307, 1999年10月01日
    日本語
  • 有限要素法を用いた応答解析によるスピーカの音響放射モデル
    田村 正剛, 秋保 政一, 長谷山 美紀, 北島 秀夫, 日本音響学会研究発表会講演論文集, 1999, 2, 525, 526, 1999年09月01日
    日本語
  • A-17-1 重みを導入した評価関数を用いたGA経路探索に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 田村 正剛, 電子情報通信学会ソサイエティ大会講演論文集, 1999, 0, 183, 183, 1999年08月16日
    一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いた経路探索における複数経路候補の決定法
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-1, 情報・システム 1-情報処理, 82, 8, 1102, 1111, 1999年08月
    本論文は遺伝的アルゴリズム(GA : Genetic Algorithm)を用いた経路探索手法を提案する. 提案手法は, GAの特徴を生かし, 最短経路を選択するだけでなく, それに準ずる複数の解候補の決定が可能である. したがって本手法を用いれば, 最短経路と異なる短い経路が要求された場合に, 新たに探索し直すことなく他の経路候補を得ることができる. このような応用は従来法では容易に実現することができない. 更に提案手法は, 経路に依存した重みを遺伝子型に組み込むことにより, 経路長が短く, かつ経由するノードが類似しない経路を決定することが可能である., 一般社団法人電子情報通信学会, 日本語
  • ディジタル画像の性質を考慮した Hough 変換の考察
    金 義鎮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 99, 180, 89, 96, 1999年07月16日
    雑音および欠落を含む画像から図形を抽出するのはHough変換がよく用いられている. しかし, Hough変換において特徴点から全パラメータ空間へ投票するので計算量が非常に大きい. 計算量を減少させるためにディジタル画像の性質を考慮したHough変換を考察する. すなわち, ディジタル画像の直線セグメントの構成および性質に関して解析を行う. 直線セグメントの方向性質を用いて1次パラメータ空間範囲を決定し, 再びセグメントの画素数で再分割を行って, 直線のピーク値が発生可能であるパラメータ空間範囲におってのみ投票する新たな分割パラメータ空間を提案する. また実験結果を用いて従来法と提案手法とを比較して提案手法の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • 動画像符号化のためのテーブル参照による動き補償
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-パターン処理, 82, 6, 1001, 1008, 1999年06月25日
    本論文では, 動画像符号化のためテーブル参照による動き補償を提案する. 様々な動きを格納した'動きテーブル'を複数フレームごとに作成し, 対象ブロックごとに動きテーブル内を探索し, ブロック内の動き補償予測誤差を最小にする動きをテーブル内から選択する. 本手法のポイントは動きに関する符号量削減のために動きベクトル数を削減することにある. 動きベクトル数の減少による画質の悪化を抑えるために, 次の二つの動きテーブル作成法を提案する. 一つ目は, 動き補償を行った際に使用される動きベクトルの出現頻度により, 動きベクトル数を削減する方法. 二つ目は, 遺伝的アルゴリズムを用いて, 動き補償予測誤差が最小になるように動きベクトル数を削減し, 動きテーブルを作成する方法である. こうして作成された動きテーブルを用いることにより, 動き補償予測画像の画質を劣化を低く抑えつつ符号量を削減することを示す. 本論文では, 動画像には動きの種類に偏りがあることを利用して, テーブルサイズを限定したテーブル参照による動き補償を用いることによって, 画質の劣化を抑えつつ従来法のブロックマッチング法より符号量の削減を実現する., 一般社団法人電子情報通信学会, 日本語
  • GAを用いた経路探索における評価関数の決定 : ビルディングブロック仮説からのアプローチ
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 99, 104, 89, 96, 1999年06月10日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.この手法は,GAにおける初期集団の発生や交叉の処理において,致死遺伝子を生じ,それらを処理するために多くの計算量を要する.本稿では,その計算量を削減するために,新たな評価関数を提案する.提案された評価関数は,ビルディングブロック仮説に基づいて制御される重みが導入されている.この重みを制御することによって,従来法で致死遺伝子が保持していた有効なスキマタを消失させずに探索でき,計算量の削減が可能となる.さらに,木稿では,局所解に陥る確率を減少させ,より良好な探索を可能とする重みの設定法についても考察する., 一般社団法人電子情報通信学会, 日本語
  • CORDIC ARMAラチスフィルタのパイプライン実現に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 99, 104, 123, 128, 1999年06月10日
    本文では,CORDIC ARMAラチスフィルタにパイプライン処理を導入,高スループットのフィルタを実現する手法を提案する.提案手法は,フィルタを構成するCORDICプロセッサ内部においてもパイプライン処理を実行するため,CORDICプロセッサを機能ブロックとしてパイプライン処理を行う場合と比較して,高いスループットを達成できる.また,パイプライン処理における機能ブロックは,加減算器とシフタからなる単純な構造を持つため,少ないハードウェア量でのフィルタの実現が可能である., 一般社団法人電子情報通信学会, 日本語
  • GAを用いた経路探索における評価関数の決定 : ビルディングブロック仮説からのアプローチ
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 99, 110, 89, 96, 1999年06月10日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.この手法は,GAにおける初期集団の発生や交叉の処理において,致死遺伝子を生じ,それらを処理するために多くの計算量を要する.本稿では,その計算量を削減するために,新たな評価関数を提案する.提案された評価関数は,ビルディングブロック仮説に基づいて制御される重みが導入されている.この重みを制御することによって,従来法で致死遺伝子が保持していた有効なスキマタを消失させずに探索でき,計算量の削減が可能となる.さらに,木稿では,局所解に陥る確率を減少させ,より良好な探索を可能とする重みの設定法についても考察する., 一般社団法人電子情報通信学会, 日本語
  • CORDIC ARMAラチスフィルタのパイプライン実現に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 99, 110, 123, 128, 1999年06月10日
    本文では,CORDIC ARMAラチスフィルタにパイプライン処理を導入,高スループットのフィルタを実現する手法を提案する.提案手法は,フィルタを構成するCORDICプロセッサ内部においてもパイプライン処理を実行するため,CORDICプロセッサを機能ブロックとしてパイプライン処理を行う場合と比較して,高いスループットを達成できる.また,パイプライン処理における機能ブロックは,加減算器とシフタからなる単純な構造を持つため,少ないハードウェア量でのフィルタの実現が可能である., 一般社団法人電子情報通信学会, 日本語
  • GAを用いた経路探索における評価関数の決定 : ビルディングブロック仮説からのアプローチ
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 99, 107, 89, 96, 1999年06月10日
    遺伝的アルゴリズム(GA)を用いて指定された複数ノードを経由する最短経路探索手法が既に提案されている.この手法は,GAにおける初期集団の発生や交叉の処理において,致死遺伝子を生じ,それらを処理するために多くの計算量を要する.本稿では,その計算量を削減するために,新たな評価関数を提案する.提案された評価関数は,ビルディングブロック仮説に基づいて制御される重みが導入されている.この重みを制御することによって,従来法で致死遺伝子が保持していた有効なスキマタを消失させずに探索でき,計算量の削減が可能となる.さらに,木稿では,局所解に陥る確率を減少させ,より良好な探索を可能とする重みの設定法についても考察する., 一般社団法人電子情報通信学会, 日本語
  • CORDIC ARMAラチスフィルタのパイプライン実現に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 99, 107, 123, 128, 1999年06月10日
    本文では,CORDIC ARMAラチスフィルタにパイプライン処理を導入,高スループットのフィルタを実現する手法を提案する.提案手法は,フィルタを構成するCORDICプロセッサ内部においてもパイプライン処理を実行するため,CORDICプロセッサを機能ブロックとしてパイプライン処理を行う場合と比較して,高いスループットを達成できる.また,パイプライン処理における機能ブロックは,加減算器とシフタからなる単純な構造を持つため,少ないハードウェア量でのフィルタの実現が可能である., 一般社団法人電子情報通信学会, 日本語
  • フルフレームDCTを用いた静止画像符号化についての考察
    季平浩治, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 52, 43, 48, 1999年06月04日
    本文は,フルフレームDCTを用いての静止画像符号化を提案する.DCTを画像符号化に用いる時は,小ブロックに分割してから各ブロックにDCTを用いる方法がよく取られる.ところが,低ビットレート下ではブロック歪が存在してしまう.一方,フルフレームDCTを用いた場合ブロック歪は存在しないが,適応的な量子化が困難である.本文では,フルフレームDCTを用いて,変換領域においてのブロック単位での適応的な量子化法を検討する.This paper proposes image coding using full-frame DCT. Conventionally an image divided into small blocks of pixels; DCT is applied to each block. However, block distortion arises under a low bit-rate. Block distortion is completely removed by using full-frame DCT, but it is diffcult to adapt quantization to local image structure. This paper proposes a quantization strategy that adapts to transform-domain image features., 一般社団法人情報処理学会, 日本語
  • 動画像符号化のための動きのテーブル化についての考察
    浅水 仁, 長谷山 美紀, 北島 秀夫, 情報処理学会研究報告オーディオビジュアル複合情報処理(AVM), 1999, 52, 49, 54, 1999年06月04日
    本文では,動画像符号化のための動きベクトルの評価値を用いた動き補償の実現について提案する.著者らが以前に提案した動きテーブルによる動き補償は,予測誤差が最小となる動きをテーブル内より選択し,動き補償を行う手法である.このため,動きテーブルの作成法により,予測画像の画質が変化する.テーブルは,探索領域や探索精度,動きベクトルの頻度等によって作成していた.さらなる高精度な動き補償の実現のための動きテーブルを作成するために,動きベクトルごとの出現頻度とブロックごとの予測誤差を用いて評価値を求め,その評価値を用いてテーブルを作成する.This paper proposes the estimation of a motion vector for motion-parameter identification in motion table. The motion compensation based on table lookup selects the motion to minimize prediction error from the motion table. Therefore, the quality of the prediction image changes making the motion table. The motion table identified by the conventional method the frequency of motion vectors. The proposed method used both frequency of motion vector and mean square error of block. A pair of motion tables sets up by distinct methods are compared., 一般社団法人情報処理学会, 日本語
  • MFM像の確率信号解析によって得られる分散の解釈
    武隈 育子, 安井 雅彦, 長谷山 美紀, 末岡 和久, 武笠 幸一, 日本応用磁気学会誌, 23, 4, 1073, 1076, 1999年04月15日
    Magnetic force microscopy (MFM) has been widely used to investigate magnetized states of recording media, and a method of analyzing MFM images as stochastic signals has been proposed. Through the analysis of the variance computed by this method, a parameter L/W was found. However, the relation between the variance variation and the recorded state of media is not well understood. In this study, in order to determine the relation, MFM output signals are simulated by using the micro-track model, and the variation in the variance around the transition region is considered. The relation between the L/W and some media parameters is investigated by meaus of the above simulation., 公益社団法人日本磁気学会, 日本語
  • フラクタルブロック符号化におけるGAを用いたIFSパラメータの量子化法
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 全国大会講演論文集, 58, 0, 285, 286, 1999年03月09日
    日本語
  • 動画像符号化のための動き補償に用いるテーブル作成法
    浅水 仁, 長谷山 美紀, 北島 秀夫, 全国大会講演論文集, 58, 0, 287, 288, 1999年03月09日
    日本語
  • IFSによる画像符号化に関する一考察
    北島 英夫, 長谷山 美紀, 電子情報通信学会総合大会講演論文集, 1999, 2, 32, 32, 1999年03月08日
    一般社団法人電子情報通信学会, 英語
  • 遺伝的アルゴリズムを用いたIFSパラメータの高精度量子化法に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 576, 75, 80, 1999年02月03日
    フラクタル画像符号化において算出される輝度値変換パラメータは,連続値をとるため量子化する必要があるが, 従来行われている最も近い量子化値を選択する量子化法では, 高品質な再生画像が得られるとは限らない. そこで, 本文では, 最適化の一手法である遺伝的アルゴリズムを用いて, 高品質な再生画像を与える量子化値を探索する手法を提案する. また, 本手法では, 輝度値変換パラメータ以外のIFSパラメータも組み合わせて探索することにより, さらに高品質な再生画像を得ることを可能とする., 一般社団法人電子情報通信学会, 日本語
  • 弾性モデルを用いた特徴点の対応決定に関する一考察
    武藤 剛史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 576, 81, 86, 1999年02月03日
    本文では, 弾性モデルを用いて2枚の画像中の特徴点が与えられた場合に, それらの対応を決定する手法を提案する. 弾性モデルを用いた特徴点の対応付け手法は既に提案されているが, 画像に複数の物体が存在する場合には, 各特徴点がどの物体に属しているかが既知でなければ, 正確な対応付け結果が得られないという問題がある. この問題を解決するために, 提案手法は, 画像中の特徴点について存在する全ての接続関係を弾性体で実現し, 実現された弾性体が持つ弾性エネルギーを算出する. この弾性エネルギーを比較することによって, どの物体に属する特徴点であるかが未知の場合でも, 特徴点の対応が決定できる., 一般社団法人電子情報通信学会, 日本語
  • 動画像における閉曲線抽出に関する検討 : Process-Grammar を用いたアプローチ
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 576, 87, 92, 1999年02月03日
    本文では複数フレームの線分画像から, 回転, 変形を伴う同一閉曲線を抽出する方法を検討する. 既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている. この手法ではProcess-Grammarを用いて輪郭線を線分に分割し, 線分の動きの類似性から同一物体を判断し線分を統合し物体を抽出している. しかし輪郭線が回転, 変形している場合には同一物体であっても線分の動きが類似せず統合が困難になるという問題があった。そこで本文では輪郭線が回転, 変形する際の線分間の相対的位置関係に注目することにより, 先に述べた問題点を解決し, 同一物体の輪郭線の抽出を実現した. この提案手法を用いて行なった実験結果を示す., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いたIFSパラメータの高精度量子化法に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 98, 574, 75, 80, 1999年02月03日
    フラクタル画像符号化において算出される輝度値変換パラメータは, 連続値をとるため量子化する必要があるが, 従来行われている最も近い量子化値を選択する量子化法では, 高品質な再生画像が得られるとは限らない. そこで, 本文では, 最適化の一手法である遺伝的アルゴリズムを用いて, 高品質な再生画像を与える量子化値を探索する手法を提案する. また, 本手法では, 輝度値変換パラメータ以外のIFSパラメータも組み合わせて探索することにより, さらに高品質な再生画像を得ることを可能とする., 一般社団法人電子情報通信学会, 日本語
  • 弾性モデルを用いた特徴点の対応決定に関する一考察
    武藤 剛史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 98, 574, 81, 86, 1999年02月03日
    本文では, 弾性モデルを用いて2枚の画像中の特徴点が与えられた場合に, それらの対応を決定する手法を提案する. 弾性モデルを用いた特徴点の対応付け手法は既に提案されているが, 画像に複数の物体が存在する場合には, 各特徴点がどの物体に属しているかが既知でなければ, 正確な対応付け結果が得られないという問題がある. この問題を解決するために, 提案手法は, 画像中の特徴点について存在する全ての接続関係を弾性体で実現し, 実現された弾性体が持つ弾性エネルギーを算出する. この弾性エネルギーを比較することによって, どの物体に属する特徴点であるかが未知の場合でも, 特徴点の対応が決定できる., 一般社団法人電子情報通信学会, 日本語
  • 動画像における閉曲線抽出に関する検討 : Process-Grammar を用いたアプローチ
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 98, 574, 87, 92, 1999年02月03日
    本文では複数フレームの線分画像から, 回転, 変形を伴う同一閉曲線を抽出する方法を検討する. 既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている. この手法ではProcess-Grammarを用いて輪郭線を線分に分割し, 線分の動きの類似性から同一物体を判断し線分を統合し物体を抽出している. しかし輪郭線が回転, 変形している場合には同一物体であっても線分の動きが類似せず統合が困難になるという問題があった. そこで本文では輪郭線が回転, 変形する際の線分間の相対的位置関係に注目することにより, 先に述べた問題点を解決し, 同一物体の輪郭線の抽出を実現した. この提案手法を用いて行なった実験結果を示す., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いたIFSパラメータの高精度量子化法に関する一考察
    竹沢 恵, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 9, 75, 80, 1999年02月03日
    フラクタル画像符号化において算出される輝度値変換パラメータは, 連続値をとるため量子化する必要があるが, 従来行われている最も近い量子化法では, 高品質な再生画像が得られるとは限らない.そこで, 本文では, 最適化の一手法である遺伝的アルゴリズムを用いて, 高品質な再生画像を与える量子化値を探索する手法を提案する.また, 本手法では, 輝度値変換パラメータ以外のIFSパラメータも組み合わせて探索することにより, さらに高品質な再生画像を得ることを可能とする., 一般社団法人映像情報メディア学会, 日本語
  • 弾性モデルを用いた特徴点の対応決定に関する一考察
    武藤 剛史, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 9, 81, 86, 1999年02月03日
    本文では, 弾性モデルを用いて2枚の画像中の特徴点が与えられた場合に, それらの対応を決定する手法を提案する.弾性モデルを用いた特徴点の対応付け手法は既に提案されているが, 画像に複数の物体が存在する場合には, 各特徴点がどの物体に属しているかが既知でなければ, 正確な対応付け結果が得られないという問題がある.この問題を解決するために, 提案手法は, 画像中の特徴点について存在する全ての接続関係を弾性体で実現し, 実現された弾性体が持つ弾性エネルギーを算出する.この弾性エネルギーを比較することによって, どの物体に属する特徴点であるかが未知の場合でも, 特徴点の対応が決定できる., 一般社団法人映像情報メディア学会, 日本語
  • 動画像における閉曲線抽出に関する検討 -Process-Grammarを用いたアプローチ-
    牛丸 主税, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 23, 9, 87, 92, 1999年02月03日
    本文では複数フレームの線分画像から, 回転, 変形を伴う同一閉曲線を抽出する方法を検討している.既に複数フレームの線分画像から輪郭線を抽出する手法が提案されている.この手法ではProcess-Grammarを用いて輪郭線を線分に分割し, 線分の動きの類似性から同一物体を判断し線分を統合し物体を抽出している.しかし輪郭線が回転, 変形している場合には同一物体であっても線分の動きが類似せず統合が困難になるという問題があった.そこで本文では輪郭線が回転, 変形する際の線分間の相対的位置関係に注目することにより, 先に述べた問題点を解決し, 同一物体の輪郭線の抽出を実現した.この提案手法を用いて行なった実験結果を示す., 一般社団法人映像情報メディア学会, 日本語
  • A transformation method of a CORDIC ARMA lattice filter for signal synthesis
    S Shiraishi, M Haseyama, H Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E82A, 2, 230, 237, 1999年02月
    This paper proposes a method to transform a CORDIC ARMA lattice filter, which is originally realized for signal analysis, into a signal synthesis lattice filter (CORDIC ARMA lattice synthesis filter). In order to perform such a transformation and then obtain the CORDIC ARMA lattice synthesis filter, we must implement the followings with CORDIC: (1) the structure of the altered lattice filter; and (2) an angle calculation module. However, we cannot achieve such an implementation as an extension of the CORDIC ARMA lattice filter algorithm. Therefore, this paper proposes CORDIC implementation schemes for both the structure and module, and then we realize the CORDIC ARMA lattice synthesis filter. By using CORDIC processors, the elementary sections of the CORDIC ARMA lattice synthesis filter are efficiently implemented without any multipliers. Since the obtained signal synthesis lattice filter consists of dedicated CORDIC processors, it keeps the advantage of the CORDIC ARMA lattice filter, that is a simple structure., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • まれなムンプス合併症の2例
    佐藤俊哉, 長谷山圭司, 井上美紀, 川浪貢, 中川俊一, 佐藤謙二, 伊藤希美, 臨床小児医学, 47, 5, 1999年
  • Hopfield NNを用いた画像復元に関する考察
    内山賢史, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • フラクタル次元の変更による線画の単純化
    上村郷志, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • パイプラインCORDIC ARMAラチスフィルタの実現に関する考察
    白石真一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • FMBを用いた画像補間法に関する一考察
    本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • 特徴psfを用いた直線検出に関する考察
    数井誠人, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • 遺伝的アルゴリズムを用いたIFSパラメータ決定の高速化に関する一考察
    竹沢恵, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • カルマンフィルタを用いたSAR画像のノイズ低減法に関する研究
    土田正芳, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • 低ビットレート動画像符号化のための新しいブロックマッチング法
    夏井知義, 浅水仁, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • エージェントを用いた線分画像のフレーム間対応に関する考察
    牛丸主税, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • ディジタル直線の方向性に基づいた逐次的直線抽出
    金義鎮, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • 弾性モデルを用いた対応点探索への遺伝的アルゴリズムの応用
    鈴木研二, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • コスト関数を用いたIFS符号化法に関する考察
    鈴木康夫, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • VHDLを用いた動き検出器の実現に関する考察
    仲川和志, 白石真一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • GA経路探索における評価関数の重みに関する検討
    稲垣潤, 長谷山美紀, 北島秀夫, 吉野光則, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • CORDICアルゴリズムを用いた動き検出器の実現に関する検討
    山下雅人, 白石真一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • フルフレームDCTによる静止画像符号化の改良
    季平浩治, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • ファジィ推論による物体抽出のためのメンバーシップ関数作成に関する考察
    岩井範幸, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1999, 1999年
  • Removal of additive white noise using an adaptive wiener filter with edge retention
    Masato Tsukahara, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 30, 1, 81, 89, 1999年
    In this paper, an adaptive Wiener filter for removal of additive white noise is proposed. Images are partitioned into a set of blocks of pixels, divided into five subsets of blocks according to their edge contents and directions, namely, shade, horizontal, vertical, and two diagonal classes. Each subset of blocks is used to define a covariance matrix, from which a Wiener filter is derived. For classification of blocks in the presence of noise, five eigenvectors calculated from the five covariance matrices are used. For a block classified into the appropriate class, five inner products are calculated between five eigenvectors and the block in the presence of noise. After classification, by switching the Wiener filter according to the input block, edge-preserving image filtering is useful. Experimental results are included to verify the usefulness of the proposed method. © 1999 Scripta Technica., John Wiley and Sons Inc., 英語
  • A filter-coefficient quantization method with genetic algorithm
    M Haseyama, H Kitajima, ISCAS '99: PROCEEDINGS OF THE 1999 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL 3, 3, 399, 402, 1999年
    A method with a genetic algorithm (GA) to quantize filter coefficients is proposed. The proposed method searches a population of the quantized filters for the optimal quantized filter which retains the frequency characteristic of a reference filter, by using the GA. In order to establish this method, we decide how to execute the following GA procedures: representation of strings; fitness (objective function); reproduction; crossover and mutation. The experimental results are included to verify that the proposed method can obtain the filter with better frequency characteristic than ones which the traditional quantization methods, such as to round off, round up, and round down, provides., IEEE, 英語
  • A criterion-based image segmentation method with a genetic algorithm
    M Haseyama, N Iwai, H Kitajima, ISCAS '99: PROCEEDINGS OF THE 1999 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL 4, 4, 94, 97, 1999年
    This paper proposes a new genetic algorithm (GA) based image segmentation method for image analysis. This method can segment an observed image into some regions based on a criterion, The criterion is defined as MSE caused by interpolating each region of the image with a parametric model. Since the criterion is expressed with not only the parameters of the model but also shape and location of the regions, the criterion can not be easily minimized by the usual optimization methods, the proposed method minimizes the criterion by a GA. The proposed method also includes a processor to eliminate small fragments with the Markov random field (MRF) model. Though the thresholds of the existent region-segmentation methods negatively affect image segmentation results; since no thresholds are required in the proposed method, it segments images more accurately than the existent methods., IEEE, 英語
  • Genetic algorithm based image segmentation for image analysis
    Miki Haseyama, Masateru Kumagai, Hideo Kitajima, ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings, 6, 3445, 3448, 1999年01月01日
    In this paper a new genetic algorithm (CA) based image segmentation method is proposed for image analysis. This method using a mean square error (MSE) based criterion can segment an image into some regions, while estimating a suitable region representation. The criterion is defined as MSE caused by interpolating each region of an observed image with a parametric model. Since the criterion is expressed with not only the parameters of the model but also shape and location of the regions, the criterion can not be easily minimized by the usual optimization methods, the proposed method minimizes the criterion by a GA. The proposed method also includes a processor to eliminate fragile regions with the Markov random field (MRF) model. Though the thresholds of the existent methods negatively affect image segmentation results; since no thresholds are required in the proposed method, it segments images more accurately than the existent methods., IEEE Computer Society
  • A genetic algorithm for determining multiple routes and its applications
    J Inagaki, M Haseyama, H Kitajima, ISCAS '99: PROCEEDINGS OF THE 1999 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL 6, 6, 137, 140, 1999年
    This paper presents a genetic algorithm approach for routing applications, The genetic algorithm produces many possible solutions in its search process. BS utilizing this feature, our method determines both the shortest route and multiple semi-shortest routes in one search. The existent methods: such as Dijkstra's algorithm, search only for the shortest route, but they cannot determine any other short, routes, Therefore proposed algorithm is useful for this kind of routing, Furthermore, the method can determine the routes which are short and not, similar depending on geographical conditions since the genotype structure of our method has a weighting factor which controls route length., IEEE, 英語
  • A real-time line extraction algorithm
    J Gates, M Haseyama, H Kitajima, ISCAS '99: PROCEEDINGS OF THE 1999 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOL 4, 4, 68, 71, 1999年
    This paper presents an algorithm that is capable of extracting lines from digital images in real-time. The algorithm uses a radial search method that quickly converges to the line segment and then the detected line is verified using the least-mean-squares (LMS) algorithm. Tests were performed on 256 x 256-grayscale images using a 166 MHz Pentium processor and an average frame-rate of more than twenty frames/second was achieved. The line extraction performance of the algorithm is comparable with that produced by the well known but much slower, Hough Transform. The algorithm is approximately two orders of magnitude faster than the Hough Transform [1][2]., IEEE, 英語
  • A shape-constraint-based active contour model
    Wen Zhong, Miki Haseyama, Hideo Kitajima, Kyokai Joho Imeji Zasshi/Journal of the Institute of Image Information and Television Engineers, 53, 10, 1421, 1429, 1999年
    An active contour model Snake and its modifications are widely used for image analysis and computer vision problems, especially for object contour extraction. To overcome some drawbacks associated with existing active contour models used for object contour extraction, this paper presents a shape-constraint-based active contour model (SC-ACM) which uses information of the contour shape of the target object to constrain the snake and controls the snake shape when the snake moves at every step, where the object contour shape is assumed to be roughly known a priori. Successful application of the SC-ACM to extraction of contours on real and synthetic images demonstrates its effectiveness., Inst. of Image Information and Television Engineers, 英語
  • A study of magnetization fluctuations in transition region using MFM image analysis
    I. Takekuma, M. Haseyama, K. Sueoka, K. Mukasa, M. Yasui, IEEE Transactions on Magnetics, 35, 5, 2685, 2687, 1999年
    This paper proposes a method for analysis of MFM (magnetic force microscopy) images. By using the proposed method, the influence of the magnetization fluctuations in transition regions can be analyzed. In the proposed method, the MFM images are processed as stochastic signals, and their stochastic parameters are obtained. The variance profile (the variance of MFM signals across the track direction), one of the parameters, is closely related to the magnetization fluctuations in the transition region. Therefore, by observation of the variance profile, the fluctuations can be quantitatively analyzed. An example of the analysis, which is based on the variance profile, is presented. From the analysis, it is found that the parameter L/W, which is introduced to characterize the variance profile, has the same trend as the S/Nm (Nm:medium noise) does. © 1999 IEEE., 英語
  • Removal of additive white noise using an adaptive wiener filter with edge retention
    Masato Tsukahara, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 30, 1, 81, 89, 1999年
    In this paper, an adaptive Wiener filter for removal of additive white noise is proposed. Images are partitioned into a set of blocks of pixels, divided into five subsets of blocks according to their edge contents and directions, namely, shade, horizontal, vertical, and two diagonal classes. Each subset of blocks is used to define a covariance matrix, from which a Wiener filter is derived. For classification of blocks in the presence of noise, five eigenvectors calculated from the five covariance matrices are used. For a block classified into the appropriate class, five inner products are calculated between five eigenvectors and the block in the presence of noise. After classification, by switching the Wiener filter according to the input block, edge-preserving image filtering is useful. Experimental results are included to verify the usefulness of the proposed method. © 1999 Scripta Technica., John Wiley and Sons Inc., 英語
  • 画像復元のための Hopfield NN に関する一考察
    内山 賢史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 484, 79, 84, 1998年12月17日
    本文では, Hopfield Neural Network(以下, HNN)による劣化画像復元の前処理として行うエッジ抽出のためのHNNに関して, より高精度なエッジ抽出を可能にする手法を提案する.HNNを用いてエッジ抽出を行う際, エッジを判定する新しいエッジパラメータを導入する.従来法では画像の縦方向・横方向の画素に対してエッジの有無を判定する2種類のエッジパラメータを用意している.本発表では, それに加えて右斜め方向・左斜め方向の画素に対してエッジを判定するパラメータを用意し, より正確なエッジの抽出が可能となる手法を提案する.また, エッジパラメータを決定する際の評価関数について, 従来法と異なる関数を導出することで計算量の削減を可能とした., 一般社団法人電子情報通信学会, 日本語
  • 形状情報を利用した動的輪郭モデルの改善法
    鐘 文, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 484, 85, 90, 1998年12月17日
    本文は既存の動的輪郭モデルにある、力と閾値を精密に設定する必要があるという欠点を改善すべく、形状に基づく動的輪郭モデル(SC-ACM)を提案する。提案手法は事前に大体の輪郭形状が分かっている対象物に対して、その輪郭形状情報を用いてSnakeの動きを拘束することにより、抽出したい対象物の輪郭を抽出する。TVニュース画像を用いて、アナウンサーの口唇輪郭を抽出する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人電子情報通信学会, 英語
  • 近似DCTを用いた静止画像のロスレス符号化
    季平 浩治, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 484, 91, 96, 1998年12月17日
    本文は, 近似DCT変換を用いた静止画像のロスレス符号化を提案する.近似DCT変換とはDCT変換の変換行列を整数行列で近似した変換である.一種の近似DCTを用いたロスレス符号化の手法はすでに提案されている.しかし, この手法には逆行列に転置行列を用いることができないという問題点がある.本文では, 逆行列に転置行列を用いることが可能であり, DCTにより近い変換を提案する.さらに, 本手法を用いてのロスレス符号化のシミュレーション結果を示す., 一般社団法人電子情報通信学会, 日本語
  • フラクタルブロック符号化法における相似領域探索法に関する考察
    鈴木 康夫, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 484, 97, 102, 1998年12月17日
    本文では, 領域が重複するドメインブロックを考慮した可変ブロックサイズのフラクタルブロック符号化を提案する.従来の可変ブロックサイズの手法で主に用いられる四分木分割法では, 画質の向上をはかると小さいサイズのブロックが増加し, 符号量が増加する.そこで本提案手法では, 四分木分割法に領域が重複するドメインブロックの探索を組み合わせ, 符号量の増加を抑えながら再生画像の画質の向上を可能とする.実験では, 四分木分割法と提案手法の両手法を用いて得られる再生画像の誤差の比較を行うことで本手法の有効性を示し, さらに, 可変ブロックサイズにする際必要となるレンジブロックを分類する閾値の設定について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • 画像復元のための Hopfield NN に関する一考察
    内山 賢史, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 98, 482, 79, 84, 1998年12月17日
    本文では, Hopfield Neural Network(以下, HNN)による劣化画像復元の前処理として行うエッジ抽出のためのHNNに関して, より高精度なエッジ抽出を可能にする手法を提案する.HNNを用いてエッジ抽出を行う際, エッジを判定する新しいエッジパラメータを導入する.従来法では画像の縦方向・横方向の画素に対してエッジの有無を葉呈する2種類のエッジパラメータを用意している.本発表では, それに加えて右斜め方向・左斜め方向の画素に対してエッジを判定するパラメータを用意し, より正確なエッジの抽出が可能となる手法を提案する.また, エッジパラメータを決定する際の評価関数について, 従来法と異なる関数を導出することで計算量の削減を可能とした., 一般社団法人電子情報通信学会, 日本語
  • 形状情報を利用した動的輪郭モデルの改善法
    鐘 文, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 98, 482, 85, 90, 1998年12月17日
    本文は既存の動的輪郭モデルにある、力と閾値を精密に設定する必要があるという欠点を改善すべく、形状に基づく動的輪郭モデル(SC-ACM)を提案する。提案手法は事前に大体の輪郭形状が分かっている対象物に対して、その輪郭形状情報を用いてSnakeの動きを拘束することにより、抽出したい対象物の輪郭を抽出する。TVニュース画像を用いて、アナウンサーの口唇輪郭を抽出する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人電子情報通信学会, 英語
  • 近似DCTを用いた静止画像のロスレス符号化
    季平 浩治, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 98, 482, 91, 96, 1998年12月17日
    本文は, 近似DCT変換を用いた静止画像のロスレス符号化を提案する.近似DCT変換とはDCT変換の変換行列を整数行列で近似した変換である.一種の近似DCTを用いたロスレス符号化の手法はすでに提案されている.しかし, この手法には逆行列に転置行列を用いることができないという問題点がある.本文では, 逆行列に転置行列を用いることが可能であり, DCTにより近い変換を提案する.さらに, 本手法を用いてのロスレス符号化のシミュレーション結果を示す., 一般社団法人電子情報通信学会, 日本語
  • フラクタルブロック符号化法における相似領域探索法に関する考察
    鈴木 康夫, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 98, 482, 97, 102, 1998年12月17日
    本文では, 領域が重複するドメインブロックを考慮した可変ブロックサイズのフラクタルブロック符号化を提案する.従来の可変ブロックサイズの手法で主に用いられる四分木分割法では, 画質の向上をはかると小さいサイズのブロックが増加し, 符号量が増加する.そこで本提案手法では, 四分木分割法に領域が重複するドメインブロックの探索を組み合わせ, 符号量の増加を抑えながら再生画像の画質の向上を可能とする.実験では, 四分木分割法と提案手法の両手法を用いて得られる再生画像の誤差の比較を行うことで本手法の有効性を示し, さらに, 可変ブロックサイズにする際必要となるレンジブロックを分類する閾値の設定について考察を行う., 一般社団法人電子情報通信学会, 日本語
  • 画像復元のためのHopfield NNに関する一考察
    内山 賢史, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 71, 79, 84, 1998年12月17日
    本文では, Hopfield Neural Network(以下, HNN)による劣化画像復元の前処理として行うエッジ抽出のためのHNNに関して, より高精度なエッジ抽出を可能にする手法を提案する.HNNを用いてエッジ抽出を行う際, エッジを判定する新しいエッジパラメータを導入する.従来法では画像の縦方向・横方向の画素に対してエッジの有無を判定する2種類のエッジパラメータを用意している.本発表では, それに加えて右斜め方向・左斜め方向の画素に対してエッジを判定するパラメータを用意し, より正確なエッジの抽出が可能となる手法を提案する.また, エッジパラメータを決定する際の評価関数について, 従来法と異なる関数を導出することで計算量の削減を可能とした., 一般社団法人映像情報メディア学会, 日本語
  • 形状情報を利用した動的輪郭モデルの改善法
    鐘 文, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 71, 85, 90, 1998年12月17日
    本文は既存の動的輪郭モデルにある、力と閾値を精密に設定する必要があるという欠点を改善すべく、形状に基づく動的輪郭モデル(SC-ACM)を提案する。提案手法は事前に大体の輪郭形状が分かっている対象物に対して、その輪郭形状情報を用いてSnakeの動きを拘束することにより、抽出したい対象物の輪郭を抽出する。TVニュース画像を用いて、アナウンサーの口唇輪郭を抽出する実験結果から、提案手法は従来法より有効であることを示す。, 一般社団法人映像情報メディア学会, 英語
  • 近似DCTを用いた静止画像のロスレス符号化
    李平 浩治, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 71, 91, 96, 1998年12月17日
    本文は, 近似DCT変換を用いた静止画像のロスレス符号化を提案する.近似DCT変換とはDCT変換の変換行列を整数行列で近似した変換である.一種の近似DCTを用いたロスレス符号化の手法はすでに提案されている.しかし, この手法には逆行列に転置行列を用いることができないという問題点がある.本文では, 逆行列に転置行列を用いることが可能であり, DCTにより近い変換を提案する.さらに, 本手法を用いてのロスレス符号化のシミュレーション結果を示す., 一般社団法人映像情報メディア学会, 日本語
  • フラクタルブロック符号化法における相似領域探索法に関する考察
    鈴木 康夫, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 71, 97, 102, 1998年12月17日
    本文では, 領域が重複するドメインブロックを考慮した可変ブロックサイズのフラクタルブロック符号化を提案する.従来の可変ブロックサイズの手法で主に用いられる四分木分割法では, 画質の向上をはかると小さいサイズのブロックが増加し, 符号量が増加する.そこで本提案手法では, 四分木分割法に領域が重複するドメインブロックの探索を組み合わせ, 符号量の増加を抑えながら再生画像の画質の向上を可能とする.実験では, 四分木分割法と提案手法の両手法を用いて得られる再生画像の誤差の比較を行うことで本手法の有効性を示し, さらに, 可変ブロックサイズにする際必要となるレンジブロックを分類する閾値の設定について考察を行う., 一般社団法人映像情報メディア学会, 日本語
  • Transformation of normalized ARMA lattice filters for the purpose of signal synthesis
    Miki Haseyama, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E81-A, 1529, 1532, 1998年12月01日
    This letter proposes a method to transform normalized ARMA lattice filters, which are originally realized for signal analysis, into signal synthesis lattice filters. Although the transformation method has been proposed for normalized ARMA lattice filters with the MA order which is greater than or equal to the AR order, it has not been done when the AR order is greater than the MA order. With the proposed method, once an ARMA lattice filter with the AR order greater than the MA order is realized, then it can be transformed to the signal synthesis filter.
  • 確率信号としての媒体のMFM像の解析
    武隈 育子, 安井 雅彦, 末岡 和久, 長谷山 美紀, 武笠 幸一, 日本応用磁気学会学術講演概要集 = Digest of ... annual conference on magnetics in Japan, 22, 474, 474, 1998年09月01日
    日本語
  • 確率信号としての磁気力顕微鏡像の解析手法
    武隈 育子, 安井 雅彦, 奥村 善信, 秋田 憲, 末岡 和久, 長谷山 美紀, 武笠 幸一, 日本応用磁気学会誌, 22, 9, 1251, 1256, 1998年09月01日
    Magnetic force microscopy(MFM) is widely used to directly observe magnetized states with sub-micron resolution. The average profile, which is commonly used in the conventional quantitative analysis of MFM images, does not contain enough information to evaluate recording media. We introduce the concept of a stochastic process into MFM image analysis. By acquiring the statistical parameters-the average, the variance, and the histogram of the image-we reveal that the distribution of the fluctuation in the magnetic transition region is different from the Gaussian distribution. We also suggest a new evaluation value, L/W, which is related to the S/N of the read-back signal. With our model, it may be possible to obtain higher-order statistical parameters, which are important for achieving more precise characterization in the magnetic transition region., 公益社団法人日本磁気学会, 日本語
  • CORDIC ARMAラチスフィルタの高精度化に関する考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 98, 232, 1, 6, 1998年07月31日
    CORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する手法が既に提案されている.しかし, この手法により実現されるCORDICラチス基本区間には, 小さな角の回転操作を実行できないという問題がある.そこで本分では, Waltherのシフト数列を用いることにより, この問題を解決し, 新たなCORDICラチス基本区間を実現する手法を提案する.提案するCORDIC ARMAラチス基本区間を用いることで、高精度なCORDIC ARMAラチスフィルタの実現が可能となる., 一般社団法人電子情報通信学会, 日本語
  • Transformation of normalized ARMA lattice filters for the purpose of signal synthesis
    M Haseyama, S Shiraishi, H Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E81A, 7, 1529, 1532, 1998年07月
    This letter proposes a method to transform normalized ARMA lattice filters, which are originally realized for signal analysis, into signal synthesis lattice filters. Although the transformation method has been proposed for normalized ARMA lattice filters with the MA order which is greater than or equal to the AR order, it has not been done when the AK order is greater than the MA order. With the proposed method, once an ARMA lattice filter with the AR order greater than the MA order is realized, then it can be transformed to the signal synthesis filter., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語, 速報,短報,研究ノート等(学術雑誌)
  • 4)反復関数系による画像処理法の検討
    本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 6, 832, 832, 1998年06月20日
    一般社団法人映像情報メディア学会, 日本語
  • 5)音声信号を利用したカット点検出手法に関する考察 : その改良と実験結果
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 6, 1998年06月20日
    一般社団法人映像情報メディア学会, 日本語
  • 6)CORDIC ARMA ラチス合成フィルタの任意次数実現法
    白石 真一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 6, 832, 832, 1998年06月20日
    一般社団法人映像情報メディア学会, 日本語
  • 動き補償のための動きテーブル作成法
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 98, 136, 63, 70, 1998年06月19日
    本文では, 動きテーブル参照による動き補償のための遺伝的アルゴリズムを用いた動きテーブル作成法を提案する.動きテーブルによる動き補償は, 動きテーブル内に収められている動きの中から予測誤差が最小の動きを選択する手法である.このため, 動きテーブルの作成法により, 予測画像の画質が変化する.従来の動きテーブルは, ブロックごとの動きを求め, ベクトル量子化により作成していた.しかし, その量子化誤差が予測画像に影響を与えてしまう.この影響を軽減するために, 遺伝的アルゴリズムを用いて予測画像に与える影響を考慮しながら動きテーブルを作成する.提案手法を用いた動きテーブル作成法と従来法の比較, 検討を行なう., 一般社団法人電子情報通信学会, 日本語
  • 8)画像符号化におけるエッジ保存を考慮した適応KL基底(放送方式研究会)
    塚原 正人, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 673, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 9)動きテーブル参照による動き補償方式に関する考察(放送方式研究会)
    浅水 仁, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 10)フラクタル次元を用いた画素補間法に関する考察(放送方式研究会)
    本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 11)ファジィ推論を用いた物体抽出のための効果的な初期領域の決定法(放送方式研究会)
    新井 哲也, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 12)複数経由点指定を伴う経路探索に関する考察(放送方式研究会)
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 1)遺伝的アルゴリズムを用いたフラクタルブロック符号化法(放送方式研究会)
    小林 亜令, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 2)アダマール変換の剰余パターンの類別を用いた静止画像のロスレス符号化(放送方式研究会)
    星野 亮, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 3)動画像のショット切換え種別の判定に関する考察(放送方式研究会)
    槙 宏晃, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 4)ファジィ理論を用いた音声データによるカット点検出の精度向上に関する考察(放送方式研究会)
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 674, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 5)物体の3次元的回転を考慮した動き補償のための動きモデル(放送方式研究会)
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 674, 675, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 6)分散が異なる雑音による劣化画像の復元に関する考察(放送方式研究会)
    熊谷 政輝, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 675, 675, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 7)信号合成のためのCORDIC ARMAラチスフィルタの実現法に関する一考察(放送方式研究会)
    白石 真一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 675, 675, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 8)IFSを用いたパルス性雑音による劣化画像の復元法(放送方式研究会)
    岡美 佳子, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 52, 5, 675, 675, 1998年05月20日
    一般社団法人映像情報メディア学会, 日本語
  • 画像のエッジ保存を考慮した適応ウィーナーフィルタによる加法性白色雑音の除去
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理, 81, 4, 623, 631, 1998年04月25日
    本論文では, 画像のエッジを保存しつつ加法性白色雑音除去を行うための適応ウィーナーフィルタを提案する.学習用の複数の画像を用意した上で, 各画像を小画像(以下ではブロックと呼ぶ)に分割して, ブロックをその内部のエッジの性質により平たん, 垂直, 水平, 斜め方向(45度, 135度)の五つのクラスに分類する.そして, クラスごとに共分散行列を求め, ウィーナーフィルタを設計する.雑音除去におけるブロックのクラス分類は, 各クラスの共分散行列の固有ベクトルを用いて行われる.各クラスの固有ベクトルとノイズの付加された観測画像のブロックとの内積をとり, 得られた内積値に基づいて入力ブロックを適切なクラスへと分類する.クラス分類後, 入力ブロックのクラスに対応したウィーナーフィルタへ切換えを行うことにより, エッジを保存した高精度な画像復元が可能となる.本論文の最後では, さまざまな実験を行い提案手法の有用性を確認する., 一般社団法人電子情報通信学会, 日本語
  • A Note on the Residues of Hadamard Transforms of Integer Signals
    北島 秀夫, 長谷山 美紀, 電子情報通信学会総合大会講演論文集, 1998, 2, 82, 82, 1998年03月06日
    一般社団法人電子情報通信学会, 英語
  • CORDICアルゴリズムを用いた規格化ARMAラチスフィルタの実現法
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. A, 基礎・境界, 81, 2, 198, 207, 1998年02月25日
    本論文ではCORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する方法を提案する.既に提案されているCORDICアルゴリズムを用いた規格化ARラチスフィルタの実現法は, 回転角の収束値, 収束速度の2点において問題があり, それを拡張し, 規格化ARMAラチスフィルタに応用することは困難である.そこで, 本論文ではこの問題を改善し, CORDIC ARMAラチスフィルタの実現を可能とする.本論文で提案するフィルタは, 規格化ARMAラチスフィルタの実現に特化したCORDICアルゴリズムを用いて実現されるため, VLSIで効果的に実現することが期待できる.更に, このフィルタは, 入力信号の推定を行いながらフィルタリングを行うことにより, 入力信号が未知の場合にも用いることができる.本論文の最後では, 実験により, 提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 反復関数系による画像処理法の検討
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 529, 23, 28, 1998年02月04日
    本文では対象画像から求められるIFSパラメータと画像との関係を調べることにより, IFSの画像解析・画像処理への応用に関する検討を行う. IFSは少数のパラメータにより画像を表現することが可能であり, 現在、主にフラクタル画像符号化の分野で用いられている. したがって, このIFSパラメータ中には, 対象画像の特微量が含まれているものと考えられる. そこで, 本文では, IFSパラメータのうち, 画像から求められるDomain Blockの位置情報に着目し, このパラメータの統計的性質を調べる.また, IFSを用いた画像のエッジの抽出を行った後, これにより得られる2値画像に着目し, その統計的性質を調べる事により, 画像とIFSパラメータとの関係を調べる. これらの実験結果により, IFSの画像解析法への応用の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • 音声信号を利用したカット点検出手法に関する考察 : その改良と実験結果
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 529, 29, 34, 1998年02月04日
    本文ではオーディオ信号を利用して動画像のカット点検出を補助する手法について検討する. 既に, オーディオ信号のソースが変化する場合にカット点の検出精度を向上させる手法が提案されている. この手法は, オーディオ信号からPARCOR係数を求め, ファジィc-means法を用いてクラスタリングを行うことによってカット点検出の補助を可能としている. しかし, クラスタリング処理を行なうので, クラスタ数を適切に選ばなければオーディオ信号の変化を検出できないという問題点があった. 本文では, 先に述べた問題点を解決するために, オーディオ信号から求めたPARCOR係数のクラスタリング手法を改良し, その実験結果について示す., 一般社団法人電子情報通信学会, 日本語
  • CORDIC ARMAラチス合成フィルタの任意次数実現法
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 529, 35, 42, 1998年02月04日
    本文では, AR次数がMA次数より大きい場合に信号分析を目的として実現されたCORDIC ARMAラチスフィルタを, 信号合成フィルタに変換する手法を提案する. 提案手法で実現されるCORDIC ARMAラチス合成フィルタは, 乗算器等を用いることなくCORDICプロセッサのみを組み合わせて効率的に実現される. さらに, この信号合成フィルタは, CORDIC ARMAラチスフィルタ同様, 簡略化されたCORDICプロセッサを用いて実現されるため, 単純な構造を持つというCORDIC ARMAラチスフィルタの利点を損なわない., 一般社団法人電子情報通信学会, 日本語
  • 適応KL基底によるエッジ保存を考慮した画像符号化
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 97, 526, 1, 6, 1998年02月04日
    エッジの性質を反映した複数のKLTを用いた画像符号化について考察する。画像中のブロックを、その内部に存在するエッジの方向でクラス分類する。その後、各クラスのブロック集合から共分散行列を求めて固有ベクトル(基底ベクトル)を算出することによりクラスの特性を反映した複数のKLT行列が得られる。提案手法では5つのKLT行列(総称して適応KLT)を用意する。実際には、画像を低周波成分画像と高周波成分画像に分解したうえで、低周波成分画像に対してはDCT符号化, 高周波成分画像(エッジ成分を多く含んだ画像)に対しては適応KLTを適用して符号化を行なう。高周波成分画像符号化において、離散コサイン変換(以後DCT)と比較して適応KLTを用いることによる有効性を検討する。, 一般社団法人電子情報通信学会, 日本語
  • テーブル参照による動き補償のための動きモデルの検討
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 97, 526, 7, 12, 1998年02月04日
    本文は、テーブル参照による動き補償のためのDCTを用いた動きモデルを提案する。提案手法は、画素毎の動きをブロック毎にDCTを行ない、その変換係数の使用する個数を決定し、IDCTを行なうことにより、動きを表現する。提案手法を用いることにより、DCT変換係数の個数を自由に設定し、テーブルを作成することができる。テーブル参照による動き補償は、符号化システムの設計の時点で、様々な動きを格納したテーブルを作成する。動き補償予測を行なう時には、対象ブロック毎にテーブルを探索し、各ブロック内の画素値の動き補償予測誤差を最小にする動きを選択し動き補償予測を行なう。このテーブル参照方式による動き補償を行なう際の動きモデルによる違いを、予測画像を求め、考察を行なう。, 一般社団法人電子情報通信学会, 日本語
  • 3次元モデルを用いた動き補償における符号量の検討
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 97, 526, 13, 18, 1998年02月04日
    本文は、3次元モデルを用いて複数フレームの動き補償を行う手法について提案する。動き補償を行う際に3次元モデルを用いて動き補償を行う手法がすでに提案されている。この手法は、3次元的な回転の動きのパターンを用意することで、精度のよい動き補償を行うことができる。しかし、3次元を表現するため、パラメータ数が増えて、符号化した際の符号量が増えてしまう可能性がある。そこで本文では、先の問題点を解決するために、3次元モデルに複数フレームにわたって同じパラメータを用いた動き補償の手法を提案する。さらに、提案手法を用いて実験を行い、本手法の有効性について示す。, 一般社団法人電子情報通信学会, 日本語
  • 反復関数系による画像処理法の検討
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 97, 527, 23, 28, 1998年02月04日
    本文では対象画像から求められるIFSパラメータと画像との関係を調べることにより, IFSの画像解析・画像処理への応用に関する検討を行う.IFSは少数のパラメータにより画像を表現することが可能であり, 現在, 主にフラクタル画像符号化の分野で用いられている.したがって, このIFSパラメータ中には, 対象画像の特微量が含まれているものと考えられる.そこで, 本文では, IFSパラメータのうち, 画像から求められる Domain Block の位置情報に着目し, このパラメータの統計的性質を調べる.また, IFSを用いた画像のエッジの抽出を行った後, これにより得られる2値画像に着目し, その統計的性質を調べる事により, 画像とIFSパラメータとの関係を調べる.これらの実験結果により, IFSの画像解析法への応用の有効性を示す., 一般社団法人電子情報通信学会, 日本語
  • 音声信号を利用したカット点検出手法に関する考察 : その改良と実験結果
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 97, 527, 29, 34, 1998年02月04日
    本文ではオーディオ信号を利用して動画像のカット点検出を補助する手法について検討する.既に, オーディオ信号のソースが変化する場合にカット点の検出精度を向上させる手法が提案されている.この手法は, オーディオ信号からPARCOR係数を求め, ファジィcーmeans法を用いてクラスタリングを行なうことによってカット点検出の補助を可能としている.しかし, クラスタリング処理を行なうので, クラスタ数を適切に選ばなければオーディオ信号の変化を検出できないという問題点があった.本文では, 先に述べた問題点を解決するために, オーディオ信号から求めたPARCOR係数のクラスタリング手法を改良し, その実験結果について示す., 一般社団法人電子情報通信学会, 日本語
  • CORDIC ARMAラチス合成フィルタの任意次数実現法
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. EID, 電子ディスプレイ, 97, 527, 35, 42, 1998年02月04日
    本文では, AR次数がMA次数より大きい場合に信号分析を目的として実現された CORDIC ARMA ラチスフィルタを, 信号合成フィルタに変換する手法を提案する.提案手法で実現されるCORDIC ARMAラチス合成フィルタは, 乗算器等を用いることなくCORDICプロセッサのみを組み合わせて効率的に実現される.さらに, この信号合成フィルタは, CORDIC ARMA ラチスフィルタ同様, 簡略化されたCORDICプロセッサを用いて実現されるため, 単純な構造を持つというCORDIC ARMAラチスフィルタの利点を損なわない., 一般社団法人電子情報通信学会, 日本語
  • 反復関数系による画像処理法の検討
    本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 9, 23, 28, 1998年02月04日
    本文では対象画像から求められるIFSパラメータと画像との関係を調べることにより, IFSの画像解析・画像処理への応用に関する検討を行う.IFSは少数のパラメータにより画像を表現することが可能であり, 現在, 主にフラクタル画像符号化の分野で用いられている.したがって, このIFSパラメータ中には, 対象画像の特徴量が含まれているものと考えられる.そこで, 本文では, IFSパラメータのうち, 画像から求められるDomain Blockの位置情報に着目し, このパラメータの統計的性質を調べる.また, IFSを用いた画像のエッジの抽出を行った後, これにより得られる2値画像に着目し, その統計的性質を調べる事により, 画像とIFSパラメータとの関係を調べる, これらの実験結果により, IFSの画像解析法への応用の有効性を示す., 一般社団法人映像情報メディア学会, 日本語
  • 音声信号を利用したカット点検出手法に関する考察-その改良と実験結果-
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 9, 29, 34, 1998年02月04日
    本文ではオーディオ信号を利用して動画像のカット点検出を補助する手法について検討する.既に, オーディオ信号のソースが変化する場合にカット点の検出精度を向上させる手法が提案されている.この手法は, オーディオ信号からPARCOR係数を求め, ファジィc-means法を用いてクラスタリングを行なうことによってカット点検出の補助を可能としている.しかし, クラスタリング処理を行なうので, クラスタ数を適切に選ばなければオーディオ信号の変化を検出できないという問題点があった.本文では, 先に述べた問題点を解決するために, オーディオ信号から求めたPARCOR係数のクラスタリング手法を改良し, その実験結果について示す., 一般社団法人映像情報メディア学会, 日本語
  • CORDIC ARMAラチス合成フィルタの任意次数実現法
    白石 真一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 9, 35, 42, 1998年02月04日
    本文では, AR次数がMA次数より大きい場合に信号分析を目的として実現されたCORDIC ARMAラチスフィルタを, 信号合成フィルタに変換する手法を提案する.提案手法で実現されるCORDIC ARMAラチス合成フィルタは, 乗算器等を用いることなくCORDICプロセッサのみを組み合わせて効率的に実現される.さらに, この信号合成フィルタは, CORDIC ARMAラチスフイルタ同様, 簡略化されたCORDICプロセッサを用いて実現されるため, 単純な構造を持つというCORDIC ARMAラチスフイルタの利点を損なわない., 一般社団法人映像情報メディア学会, 日本語
  • 適応KL基底によるエッジ保存を考慮した画像符号化
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 528, 1, 6, 1998年02月03日
    エッジの性質を反映した複数のKLTを用いた画像符号化について考察する.画像中のブロックを, その内部に存在するエッジの方向でクラス分類する.その後, 各クラスのブロック集合から共分散行列を求めて固有ベクトル(基底ベクトル)を算出することによりクラスの特性を反映した複数のKLT行列が得られる.提案手法では5つのKLT行列(総称して適応KLT)を用意する.実際には, 画像を低周波成分画像と高周波成分画像に分解したうえで, 低周波成分画像に対してはDCT符号化, 高周波成分画像(エッジ成分を多く含んだ画像)に対しては適応KLTを適用して符号化を行なう.高周波成分画像符号化において, 離散コサイン変換(以後DCT)と比較して適応KLTを用いることによる有効性を検討する., 一般社団法人電子情報通信学会, 日本語
  • テーブル参照による動き補償のための動きモデルの検討
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 528, 7, 12, 1998年02月03日
    本文は, テーブル参照による動き補償のためのDCTを用いた動きモデルを提案する.提案手法は, 画素毎の動きをブロック毎にDCTを行ない, その変換係数の使用する個数を決定し, IDCTを行なうことにより, 動きを表現する.提案手法を用いることにより, DCT変換係数の個数を自由に設定し、テーブルを作成することができる.テーブル参照による動き補償は, 符号化システムの設計の時点で, 様々な動きを格納したテーブルを作成する.動き補償予測を行なう時には, 対象ブロック毎にテーブルを探索し, 各ブロック内の画素値の動き補償予測誤差を最小にする動きを選択し動き補償予測を行なう.このテーブル参照方式による動き補償を行なう際の動きモデルによる違いを予測画像を求め, 考察を行なう., 一般社団法人電子情報通信学会, 日本語
  • 3次元モデルを用いた動き補償における符号量の検討
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 528, 13, 18, 1998年02月03日
    本文は, 3次元モデルを用いて複数フレームの動き補償を行う手法について提案する.動き補償を行う際に3次元モデルを用いて動き補償を行う手法がすでに提案されている.この手法は, 3次元的な回転の動きのパターンを用意することで, 精度のよい動き補償を行うことができる.しかし, 3次元を表現するため, パラメータ数が増えて, 符号化した際の符号量が増えてしまう可能性がある.そこで本文では, 先の問題点を解決するために, 3次元モデルに複数フレームにわたって同じパラメータを用いた動き補償の手法を提案する.さらに, 提案手法を用いて実験を行い, 本手法の有効性について示す., 一般社団法人電子情報通信学会, 日本語
  • 適応KL基底によるエッジ保存を考慮した画像符号化
    塚原 正人, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 8, 1, 6, 1998年02月03日
    エッジの性質を反映した複数のKLTを用いた画像符号化について考察する.画像中のブロックを, その内部に存在するエッジの方向でクラス分類する.その後, 各クラスのブロック集合から共分散行列を求めて固有ベクトル(基底ベクトル)を算出することによりクラスの特性を反映した複数のKLT行列が得られる.提案手法では5つのKLT行列(総称して適応KLT)を用意する.実際には, 画像を低周波成分画像と高周波成分画像に分解したうえで, 低周波成分画像に対してはDCT符号化, 高周波成分画像(エッジ成分を多く含んだ画像)に対しては適応KLTを適用して符号化を行なう.高周波成分画像符号化において, 離散コサイン変換(以後DCT)と比較して適応KLTを用いることによる有効性を検討する., 一般社団法人映像情報メディア学会, 日本語
  • テーブル参照による動き補償のための動きモデルの検討
    浅水 仁, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 8, 7, 12, 1998年02月03日
    本文は, テーブル参照による動き補償のためのDCTを用いた動きモデルを提案する.提案手法は, 画素毎の動きをブロック毎にDCTを行ない, その変換係数の使用する個数を決定し, IDCTを行なうことにより, 動きを表現する.提案手法を用いることにより, DCT変換係数の個数を自由に設定し, テーブルを作成することができる, テーブル参照による動き補償は, 符号化システムの設計の時点で, 様々な動きを格納したテーブルを作成する, 動き補償予測を行なう時には, 対象ブロック毎にテーブルを探索し, 各ブロック内の画素値の動き補償予測誤差を最小にする動きを選択し動き補償予測を行なう.このテーブル参照方式による動き補償を行なう際の動きモデルによる違いを, 予測画像を求め, 考察を行なう., 一般社団法人映像情報メディア学会, 日本語
  • 3次元モデルを用いた動き補償における符号量の検討
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 22, 8, 13, 18, 1998年02月03日
    本文は, 3次元モデルを用いて複数フレームの動き補償を行う手法について提案する.動き補償を行う際に3次元モデルを用いて動き補償を行う手法がすでに提案されている.この手法は, 3次元的な回転の動きのパターンを用意することで, 精度のよい動き補償を行うことができる.しかし, 3次元を表現するため, パラメータ数が増えて, 符号化した際の符号量が増えてしまう可能性がある.そこで本文では, 先の問題点を解決するために, 3次元モデルに複数フレームにわたって同じパラメータを用いた動き補償の手法を提案する。さらに, 提案手法を用いて実験を行い, 本手法の有効性について示す., 一般社団法人映像情報メディア学会, 日本語
  • CORDICアルゴリズムを用いた動き検出器の実現に関する考察
    山下雅人, 白石真一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • Collage定理に基づくIFSパラメータ決定法に関する一考察
    本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 画像復元のためのHopfield NNによるエッジ抽出に関する考察
    内山賢史, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 複数経由点指定を伴う巡回経路探索への遺伝的アルゴリズムの応用
    稲垣潤, 長谷山美紀, 北島秀夫, 高堰茂, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 形状に基づく動的輪郭モデルを用いた口唇輪郭の抽出
    鐘文, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • DCTを用いた静止画像の可逆符号化に関する一考察
    季平浩治, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 弾性モデルを用いた対応点探索に関する考察
    武藤剛史, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 色成分を考慮したファジィ推論による物体抽出のための初期領域決定法
    岩井範幸, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • Process Grammarを用いた動画像における閉曲線追跡に関する一考察
    牛丸主税, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 動きテーブル参照による動き補償を用いた符号量削減
    浅水仁, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • CORDIC ARMAラチスフィルタの高精度実現に関する一考察
    白石真一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 重複するDomain Blockを考慮した可変ブロックサイズIFSに関する考察
    鈴木康夫, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • オーディオ信号の周波数特性を用いたカット点検出手法の改良
    薄田隆博, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 3次元モデルを用いた複数フレーム動き補償
    小池理一郎, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • レーダ像再生処理手法のパラメータ評価
    土田正芳, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • GAの基本的処理を用いた領域分割手法に関する考察
    熊谷政輝, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 遺伝的アルゴリズムを用いたIFSパラメータの線形量子化法に関する一考察
    竹沢恵, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1998, 1998年
  • 信号合成のための規格化ARMAラティスフィルタの実現に関する考察
    長谷山美紀, 白石真一, 北島秀夫, 電子情報通信学会大会講演論文集, 1998, 1998年
  • A fuzzy reasoning based arma order selection method
    Miki Haseyama, Hideo Kitajima, European Signal Processing Conference, 1998-January, 1, 4, 1998年01月01日
    A fuzzy reasoning based approach for ARMA order selection is discussed in this paper. The proposed method attempts to select the optimal ARMA order of a time-varying ARMA model. This method improves model validity-criterion based order selection, such as the AIC (Akaike's Information Criterion) and the MDL (Minimum Description Length), etc with applying both of a fuzzy reasoning method and a fuzzy c-means clustering method. These fuzzy methods are incorporated in the proposed method as the follows: (1) Suppose the ARMA order of the reference time-varying model changes, the suitable ARMA order is selected by utilizing a recursive fuzzy reasoning method. (2) By using the fuzzy c-means clustering method, we detect the time at which the ARMA order of the reference model changes, and the clustering values are used for adaptively setting the forgetting factor in the recursive fuzzy reasoning method. The experimental results show that the proposed method effectively selects the ARMA orders of a time-varying ARMA model., IEEE
  • An implementation of a normalized ARMA lattice filter with a CORDIC algorithm
    S Shiraishi, M Haseyama, H Kitajima, ISCAS '98 - PROCEEDINGS OF THE 1998 INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOLS 1-6, 5, D253, D256, 1998年
    This paper presents a CORDIC (COordinate Rotation DIgital Computer) implementation of a normalized ARMA lattice filter. Since the proposed method uses a simplified CORDIC algorithm it is possible to implement the CORDIC ARMA lattice filter with a reduced amount of hardware. In addition, we propose a method which transforms the CORDIC ARMA lattice filter realized for signal analysis into a signal synthesis filter without an increase in the implementation complexity. Moreover, the proposed filter can identify unknown-input models so that it can be widely used in the digital signal processing., IEEE, 英語
  • A fuzzy reasoning based approach for ARMA order selection
    M Haseyama, M Emura, H Kitajima, ISCAS '98 - PROCEEDINGS OF THE 1998 INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS, VOLS 1-6, 3, B259, B262, 1998年
    A fuzzy reasoning based approach for ARMA order selection is discussed in this paper. The proposed method attempts to select the optimal ARMA order of a time-varying ARMA model. This method improves model validity-criterion based order selection, such as the AIC (Akaike's Information Criterion) and the MDL (Minimum Description Length), etc with applying both of a fuzzy reasoning method and a fuzzy c-means clustering method. These fuzzy methods are incorporated in the proposed method as follows: (1) Suppose the ARMA order of the reference time-varying model changes. The suitable ARMA order is selected by utilizing a recursive fuzzy reasoning method. (2) By using a fuzzy c-means clustering method, we detect the time at which the ARMA order of the reference model changes, and the clustering values are used for adaptive setting the forgetting factor in the recursive fuzzy reasoning method. The experimental results show that the proposed method effectively selects the ARMA orders of a time-varying ARMA model., IEEE, 英語
  • Image modeling and parameter identification for image restoration using a Kalman filter
    Takashi Jo, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 29, 3, 1, 9, 1998年
    This paper proposes a Kalman filter based method for high accuracy image restoration. When a Kalman filter is applied to image restoration, the model of the original image affects the accuracy of the restoration. An effective model for restoration depends on the characteristics of the image or the condition of the observed image. On the other hand, the correlation of the original image and the variance of the noise are necessary for image restoration with a Kalman filter. If these parameters are unknown, they must be identified from an observed image which has been contaminated with additive noise. To address the above problems, a method is proposed that identifies the number of pixels used for estimation and their positions. A method to estimate the unknown parameters in the image restoration process is also proposed. In this paper, the performance of the proposed algorithm is verified by simulations. ©1998 Scripta Technica., John Wiley and Sons Inc., 英語
  • 能動騒音制御のための仮想参照信号生成手法について
    秋保 政一, 長谷山 美紀, 北島 秀夫, Journal of the Acoustical Society of Japan (E), 19, 2, 95, 103, 1998年
    This paper proposes a method that provides a new set of linear fixed coefficients filters to define and synthesize a new set of reference signals that are fewer in number than the original set of reference signals. It also can be used as the reference signals for an active noise cancellation system. To optimize the performance of the active noise cancellation system, it is very important to find proper reference signals that are coherent with the target noise. In a case of active road noise cancellation in a vehicle cabin, for satisfying this particular requirement, many accelerometers are installed to detect vibration on the vehicle's suspension mechanism. In most cases, these reference signals contain information about fewer number of noise sources compared to the number of accelerometers. Proposing the linear filtering method that is based on Singular Value Decomposition (SVD) of the power spectrum matrix of the reference signals enables the synthesis of the virtual reference signals. After defining the frequency response functions of the filters, we design the ARMA direct form digital filters. After designing the fixed coefficients filters for the virtual reference signals, we evaluate the performance of the ANC system through experimental tests and its results by comparing the original reference signals and the virtual reference signals to confirm the proposed method., 一般社団法人日本音響学会, 英語
  • Image modeling and parameter identification for image restoration using a Kalman filter
    Takashi Jo, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 29, 3, 1, 9, 1998年
    This paper proposes a Kalman filter based method for high accuracy image restoration. When a Kalman filter is applied to image restoration, the model of the original image affects the accuracy of the restoration. An effective model for restoration depends on the characteristics of the image or the condition of the observed image. On the other hand, the correlation of the original image and the variance of the noise are necessary for image restoration with a Kalman filter. If these parameters are unknown, they must be identified from an observed image which has been contaminated with additive noise. To address the above problems, a method is proposed that identifies the number of pixels used for estimation and their positions. A method to estimate the unknown parameters in the image restoration process is also proposed. In this paper, the performance of the proposed algorithm is verified by simulations. ©1998 Scripta Technica., John Wiley and Sons Inc., 英語
  • 遺伝的アルゴリズムを用いたフラクタルブロック符号化法
    小林 亜令, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 1, 6, 1997年12月12日
    本文では, 遺伝的アルゴリズムを用いた可変ブロックサイズのフラクタルブロツク符号化法を提案する. これまでIFSパラメータの量子化誤差が再生画像に多大な影響を及ぼすという問題点を解決するために, 固定ブロックサイズにおける遺伝的アルゴリズムを用いた量子化法を提案した。しかしその手法をそのまま可変ブロックサイズに応用すると、量子化誤差の影響が残るという問題を生ずる。そこで提案手法は、ブロックサイズにおけるIFSパラメータの統計的性質を利用して量子化値を決定し, その中から誤差の小さい再生画像を与えるIFSパラメータを遺伝的アルゴリズムを用いて決定する. 本文ではまずレンジブロックを分割する際の閾値について考察する。さらに提案アルゴリズムを用いた実験結果を示し, その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • アダマール変換の剰余パターンの類別を用いた静止画像のロスレス符号化
    星野 亮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 7, 12, 1997年12月12日
    本文はアダマール変換により得られる変換係数の剰余パターンに着目した静止画像のロスレス符号化法を提案する. N×N次のアダマール変換で計算される変換係数をN×Nで割った剰余には, そのブロック毎のパターンがある決まった種類に限定されるという特微があることが既に提案されている. 提案手法ではこの特徴を利用することで低ビットレート符号化を実現する. また, 剰余パターンを省略することにより更に符号量を削減し, 高精度の復号化画像を得ることができる準ロスレス符号化法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 動画像のショット切換え種別の判定に関する考察
    槇 宏晃, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 13, 18, 1997年12月12日
    本文では, 動画像のショット切換え種別の判定法を提案する. 従来法においてはショットが徐々に切り換わるディゾルブ, ワイプなどの検出もれが生じるという問題点がある. 提案手法ではフレームをブロックに分割し, ブロック毎に動き検出を行う. この結果により求められるフレームの類似度からショット切換えを検出する. また動き検出の精度の低いブロックの分布からショット切換えの種別を判定する. また本手法によるショット切換えの評価結果を示し、有効性を確認する, 一般社団法人電子情報通信学会, 日本語
  • ファジィ理論を用いた音声データによるカット点検出の精度向上に関する考察
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 19, 24, 1997年12月12日
    本文では, 従来のカット点検出手法で検出が困難とされているフェードやワイプ等について, その検出精度を向上させるために, ビテオ信号に対応する音声データを用いる手法について検討を行う. 提案手法は, 音声データからPARCOR(偏自己相関)係数を求め, ファジイc-meansクラスタリングを用いて, 画像データにより推定されているカット点部分の音声信号を複数のクラスタに分類する. 得られたクラスタ値が大きく変化する時刻に画像のカット点が存在する可能性があることに注目し, カット点検出の精度向上のために応用する., 一般社団法人電子情報通信学会, 日本語
  • 物体の3次元的回転を考慮した動き補償のための動きモデル
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 25, 30, 1997年12月12日
    本文は, 3次元的回転を考慮した動きモデルを用いた動き補償法を提案する. 従来の動き補償法で用いられているブロックマッチングは, 物体の3次元上での動きは考慮していない. そこで, 提案手法では, 物体モデルとして球を用い, ブロックを球に投影して, 球を回転させることで3次元上での動きを表現している. 本文では, 提案手法を用いた動き補償の実験結果を示し, モデルとして球を用いることの有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 分散が異なる雑音による劣化画像の復元に関する考察
    熊谷 政輝, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 31, 36, 1997年12月12日
    本文では, 画像の各部分で付加した雑音の分散が異なる劣化画像をカルマンフィルタにより復元する手法を提案する. カルマンフィルタを用いて画像を復元する場合, 一般には一枚の画像に対して画像のモデルとパラメータ(雑音の分散, 原画像の分散などの統計量)が既知である必要がある. 従って, 画像の各部分で付加した雑音の分散が異なる劣化画像に対しては高精度な復元が行われない. そこで, 本手法では画像の領域分割手法とカルマンフィルタアルゴリズムを併用することで, 雑音の分散が異なる部分ごとに適した分散を推定し, 各部分でカルマンフィルタを用いることで高精度な復元を可能とする., 一般社団法人電子情報通信学会, 日本語
  • 信号合成のためのCORDIC ARMAラチスフィルタの実現法に関する一考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 37, 42, 1997年12月12日
    本文では, 信号分析のためのCORDIC ARMAラチスフィルタを信号合成フィルタに変換する手法を提案する. 提案手法で実現されるCORDIC ARMAラチス合成フィルタは, 乗算器等を用いることなくCORDICプロセッサのみを組み合わせて効率的に実現される. さらに, この信号合成フィルタは, CORDIC ARMAラチスフィルタ同様, 単純化されたCORDICプロセッサを用いて実現されるため, 単純な構造を持つというCORDIC ARMAラチスフィルタの利点を損なわない., 一般社団法人電子情報通信学会, 日本語
  • IFSを用いたパルス性雑音による劣化画像の復元法
    一岡 美佳子, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 430, 43, 47, 1997年12月12日
    パルス性雑音による劣化画像の復元方法として, 様々な非線形フィルタが提案されている. 例えば, メディアンフィルタを用いた場合には, 雑音は除去されるが, エッジ部分がぼけてしまうという欠点がある. それに対して, 以前に提案したIFSを用いた画像復元方法では, 雑音の密度が低い場合には, エッジ部分がぼけず良好な復元結果となる. しかし, 雑音の密度が高い場合には, 画像をパラメータで表しそのパラメータを用いて画像を再生するため, パラメータが雑音の影響を受けて画像が良好に復元されないという欠点がある. そこで本文では, メディアンフィルタを用いて劣化画像中の雑音を評価し, IFSパラメータに対する雑音の影響を削減し, 画像を復元する方法について提案する., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いたフラクタルブロック符号化法
    小林 亜令, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 1, 6, 1997年12月12日
    本文では, 遺伝的アルゴリズムを用いた可変ブロックサイズのフラクタルブロツク符号化法を提案する. これまでIFSパラメータの量子化誤差が再生画像に多大な影響を及ぼすという問題点を解決するために, 固定ブロックサイズにおける遺伝的アルゴリズムを用いた量子化法を提案した。しかしその手法をそのまま可変ブロックサイズに応用すると、量子化誤差の影響が残るという問題を生ずる。そこで提案手法は、ブロックサイズにおけるIFSパラメータの統計的性質を利用して量子化値を決定し, その中から誤差の小さい再生画像を与えるIFSパラメータを遺伝的アルゴリズムを用いて決定する. 本文ではまずレンジブロックを分割する際の閾値について考察する。さらに提案アルゴリズムを用いた実験結果を示し, その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • アダマール変換の剰余パターンの類別を用いた静止画像のロスレス符号化
    星野 亮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 7, 12, 1997年12月12日
    本文はアダマール変換により得られる変換係数の剰余パターンに着目した静止画像のロスレス符号化法を提案する. N×N次のアダマール変換で計算される変換係数をN×Nで割った剰余には, そのブロック毎のパターンがある決まった種類に限定されるという特微があることが既に提案されている. 提案手法ではこの特徴を利用することで低ビットレート符号化を実現する. また, 剰余パターンを省略することにより更に符号量を削減し, 高精度の復号化画像を得ることができる準ロスレス符号化法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 動画像のショット切換え種別の判定に関する考察
    槇 宏晃, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 13, 18, 1997年12月12日
    本文では, 動画像のショット切換え種別の判定法を提案する. 従来法においてはショットが徐々に切り換わるディゾルブ, ワイプなどの検出もれが生じるという問題点がある. 提案手法ではフレームをブロックに分割し, ブロック毎に動き検出を行う. この結果により求められるフレームの類似度からショット切換えを検出する. また動き検出の精度の低いブロックの分布からショット切換えの種別を判定する. また本手法によるショット切換えの評価結果を示し、有効性を確認する, 一般社団法人電子情報通信学会, 日本語
  • ファジィ理論を用いた音声データによるカット点検出の精度向上に関する考察
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 19, 24, 1997年12月12日
    本文では, 従来のカット点検出手法で検出が困難とされているフェードやワイプ等について, その検出精度を向上させるために, ビテオ信号に対応する音声データを用いる手法について検討を行う. 提案手法は, 音声データからPARCOR(偏自己相関)係数を求め, ファジイc-meansクラスタリングを用いて, 画像データにより推定されているカット点部分の音声信号を複数のクラスタに分類する. 得られたクラスタ値が大きく変化する時刻に画像のカット点が存在する可能性があることに注目し, カット点検出の精度向上のために応用する., 一般社団法人電子情報通信学会, 日本語
  • 物体の3次元的回転を考慮した動き補償のための動きモデル
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 25, 30, 1997年12月12日
    本文は, 3次元的回転を考慮した動きモデルを用いた動き補償法を提案する. 従来の動き補償法で用いられているブロックマッチングは, 物体の3次元上での動きは考慮していない. そこで, 提案手法では, 物体モデルとして球を用い, ブロックを球に投影して, 球を回転させることで3次元上での動きを表現している. 本文では, 提案手法を用いた動き補償の実験結果を示し, モデルとして球を用いることの有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 分散が異なる雑音による劣化画像の復元に関する考察
    熊谷 政輝, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 31, 36, 1997年12月12日
    本文では, 画像の各部分で付加した雑音の分散が異なる劣化画像をカルマンフィルタにより復元する手法を提案する. カルマンフィルタを用いて画像を復元する場合, 一般には一枚の画像に対して画像のモデルとパラメータ(雑音の分散, 原画像の分散などの統計量)が既知である必要がある. 従って, 画像の各部分で付加した雑音の分散が異なる劣化画像に対しては高精度な復元が行われない. そこで, 本手法では画像の領域分割手法とカルマンフィルタアルゴリズムを併用することで, 雑音の分散が異なる部分ごとに適した分散を推定し, 各部分でカルマンフィルタを用いることで高精度な復元を可能とする., 一般社団法人電子情報通信学会, 日本語
  • 信号合成のためのCORDIC ARMAラチスフィルタの実現法に関する一考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 37, 42, 1997年12月12日
    本文では, 信号分析のためのCORDIC ARMAラチスフィルタを信号合成フィルタに変換する手法を提案する. 提案手法で実現されるCORDIC ARMAラチス合成フィルタは, 乗算器等を用いることなくCORDICプロセッサのみを組み合わせて効率的に実現される. さらに, この信号合成フィルタは, CORDIC ARMAラチスフィルタ同様, 単純化されたCORDICプロセッサを用いて実現されるため, 単純な構造を持つというCORDIC ARMAラチスフィルタの利点を損なわない., 一般社団法人電子情報通信学会, 日本語
  • IFSを用いたパルス性雑音による劣化画像の復元法
    一岡 美佳子, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 428, 43, 47, 1997年12月12日
    パルス性雑音による劣化画像の復元方法として, 様々な非線形フィルタが提案されている. 例えば, メディアンフィルタを用いた場合には, 雑音は除去されるが, エッジ部分がぼけてしまうという欠点がある. それに対して, 以前に提案したIFSを用いた画像復元方法では, 雑音の密度が低い場合には, エッジ部分がぼけず良好な復元結果となる. しかし, 雑音の密度が高い場合には, 画像をパラメータで表しそのパラメータを用いて画像を再生するため, パラメータが雑音の影響を受けて画像が良好に復元されないという欠点がある. そこで本文では, メディアンフィルタを用いて劣化画像中の雑音を評価し, IFSパラメータに対する雑音の影響を削減し, 画像を復元する方法について提案する., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いたフラクタルブロック符号化報
    小林 亜令, 長谷山 美紀, 本多 博之, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 1, 6, 1997年12月12日
    本文では, 遺伝的アルゴリズムを用いた可変ブロックサイズのフラクタルブロック符号化法を提案する.これまでIFSパラメータの量子化誤差が再生画像に多大な影響を及ぼすという問題点を解決するために, 固定ブロックサイズにおける遺伝的アルゴリズムを用いた量子化法を提案した。しかしその手法をそのまま可変ブロックサイズに応用すると、量子化誤差の影響が残るという問題を生ずる。そこで提案手法は、ブロックサイズにおけるIFSパラメータの統計的性質を利用して量子化値を決定し, その中から誤差の小さい再生画像を与えるIFSパラメータを遺伝的アルゴリズムを用いて決定する.本文ではまずレンジブロックを分割する際の閾値について考察する。さらに提案アルゴリズムを用いた実験結果を示し, その有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • アダマール変換の剰余パターンの類別を用いた静止画像のロスレス符号化
    星野 亮, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 7, 12, 1997年12月12日
    本文はアダマール変換により得られる変換係数の剰余パターンに着目した静止画像のロスレス符号化法を提案する.N×N次のアダマール変換で計算される変換係数をN×Nで割った剰余には, そのブロック毎のパターンがある決まった種類に限定されるという特徴があることが既に提案されている.提案手法ではこの特徴を利用することで低ビットレート符号化を実現する, また, 剰余パターンを省略することにより更に符号量を削減し, 高精度の復号化画像を得ることができる準ロスレス符号化法を提案する., 一般社団法人映像情報メディア学会, 日本語
  • 動画像のショット切換え種別の判定に関する考察
    槇 宏晃, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 13, 18, 1997年12月12日
    本文では, 動画像のショット切換え種別の判定法を提案する.従来法においてはショットが徐々に切り換わるディゾルブ, ワイプなどの検出もれが生じるという問題点がある.提案手法ではフレームをブロックに分割し, ブロック毎に動き検出を行う.この結果により求められるフレームの類似度からショット切換えを検出する.また動き検出の精度の低いブロックの分布からショット切換えの種別を判定する.また本手法によるショット切換えの評価結果を示し、有効性を確認する, 一般社団法人映像情報メディア学会, 日本語
  • ファジィ理論を用いた音声データによるカット点検出の精度向上に関する考察
    薄田 隆博, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 19, 24, 1997年12月12日
    本文では、従来のカット点検出手法で検出が困難とされているフェードやワイプ等について, その検出精度を向上させるために, ビデオ信号に対応する音声データを用いる手法について検討を行う.提案手法は, 音声データからPARCOR(偏自己相関)係数を求め, ファジィc-meansクラスタリングを用いて, 画像データにより推定されているカット点部分の音声信号を複数のクラスタに分類する.得られたクラスタ値が大きく変化する時刻に画像のカット点が存在する可能性があることに注目し, カット点検出の精度向上のために応用する., 一般社団法人映像情報メディア学会, 日本語
  • 物体の3次元的回転を考慮した動き補償のための動きモデル
    小池 理一郎, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 25, 30, 1997年12月12日
    本文は, 3次元的回転を考慮した動きモデを用いた動き補償法を提案する.従来の動き補償法で用いられているブロックマッチングは, 物体の3次元上での動きは考慮していない.そこで, 提案手法では, 物体モデルとして球を用い, プロックを球に投影して, 球を回転させることで3次元上での動きを表現している.本文では, 提案手法を用いた動き補償の実験結果を示し, モデルとして球を用いることの有効性を確認する., 一般社団法人映像情報メディア学会, 日本語
  • 分散が異なる雑音による劣化画像の復元に関する考察
    熊谷 政輝, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 31, 36, 1997年12月12日
    本文では, 画像の各部分で付加した雑音の分散が異なる劣化画像をカルマンフィルタにより復元する手法を提案する.カルマンフィルタを用いて画像を復元する場合.一般には一枚の画像に対して画像のモデルとパラメータ(雑音の分散, 原画像の分散などの統計量)が既知である必要がある.従って, 画像の各部分で付加した雑音の分散が異なる劣化画像に対しては高精度な復元が行われない.そこで, 本手法では画像の領域分割手法とカルマンフィルタアルゴリズムを併用することで, 雑音の分散が異なる部分ごとに適した分散を推定し, 各部分でカルマンフィルタを用いることで高精度な復元を可能とする., 一般社団法人映像情報メディア学会, 日本語
  • 信号合成のための CORDIC ARAMA ラチスフィルタの実現法に関する一考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 37, 42, 1997年12月12日
    本文では, 信号分析のためのCORDIC ARMAラチスフィルタを信号合成フィルタに変換する手法を提案する.提案手法で実現されるCORDIC ARMAラチス合成フィルタは, 乗算器等を用いることなくCORDICプロセッサのみを組み合わせて効率的に実現される.さらに, この信号合成フィルタは, CORDIC ARMAラチスフィルタ同様, 単純化されたCORDICプロセッサを用いて実現されるため, 単純な構造を持つというCORDIC ARMAラチスフィルタの利点を損なわない., 一般社団法人映像情報メディア学会, 日本語
  • IFSを用いたパルス性雑音による劣化画像の復元法
    本多 博之, 岡 美佳子, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 78, 43, 48, 1997年12月12日
    パルス性雑音による劣化画像の復元方法として, 様々な非線形フィルタが提案されている.例えば, メディアンフィルタを用いた場合には, 雑音は除去されるが, エッジ部分がぼけてしまうという欠点がある.それに対して, 以前に提案したIFSを用いた画像複元方法では, 雑音の密度が低い場合には, エッジ部分がぼけず良好な復元結果となる.しかし, 雑音の密度が高い場合には, 画像をパラメータで表しそのパラメータを用いて画像を再生するため, パラメータが雑音の影響を受けて画像が良好に復元されないという欠点がある.そこで本文では, メディアンフィルタを用いて劣化画像中の雑音を評価し, IFSパラメータに対する雑音の影響を削減し, 画像を復元する方法について提案する., 一般社団法人映像情報メディア学会, 日本語
  • 画像符号化におけるエッジ保存を考慮した適応KL基底
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 429, 45, 49, 1997年12月11日
    エッジの性質を反映した適応KL基底を用いた画像符号化を行なう. 画像中の小画像(実際には固定サイズのブロック)に存在するエッジの方向でブロックをクラス分類し, そのクラスの特性を反映した適応KL基底を設計する. 実際には, 画像を高周波成分と低周波成分に分解したうえで, エッジ画像(高周波成分)に対して適応KL基底を設計し, 符号化を行なう. そして, 固定基底である離散コサイン変換(以後DCT)と比較し, その有効性を検討する., 一般社団法人電子情報通信学会, 日本語
  • 動きテーブル参照による動き補償方式に関する考察
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 429, 51, 56, 1997年12月11日
    本文は, 動画像符号化のための新しい動き補償方式を提案する. 提案手法では, 符号化システムの設計の時点で, 様々な動きを格納した動きテーブルを作成する. 提案手法により動き補償予測を行なう時には, 対象ブロック毎に動きテーブルを探索し, 各ブロック内の画素値の動き補償予測誤差を最小にする動きを選択し動き補償予測を行なう. 動きテーブルの2種類の作成法について説明し, 作成法の違いによる再生画像への影響を実験結果を示し, 考察する., 一般社団法人電子情報通信学会, 日本語
  • フラクタル次元を用いた画素補間法に関する考察
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 429, 57, 62, 1997年12月11日
    本文では, フラクタル次元を用いた自然画像に対する画像補間法について提案する. 画像の拡大を行う場合等に用いられることの多い線形補間やスプライン補間では, 画像の高周波成分か失われ, これが補間後の画像の誤差原因となる. そこで, 本手法では, 補間対象となる画像からフラクタル次元を推定し, これを利用する事で画像の持つフラクタル性を利用し, 線形補間などの従来法に比べ誤差が少ない補間を行う. これは, フラクタル次元と人間の知覚する粗さの尺度と強い相関があることを利用している. これまで, 画像のフラクタル次元から, 複雑な形状を生成しようとする試みは, 地形・山岳データに対しては盛んに行われてきた. 本文では, これまで主に山岳データの補間に用いられてきたフラクタル疑似補間法に変更を加え, 人物像等の自然画像に対して適用する., 一般社団法人電子情報通信学会, 日本語
  • ファジィ推論を用いた物体抽出のための効果的な初期領域の決定法
    新井 哲也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 429, 63, 68, 1997年12月11日
    本文では, 動画像からの物体抽出に適した領域分割法を提案する. 本手法では画像を単純領域拡張法によって領域分割し, 各々の領域の重心を用いてk-平均クラスタリングを行ない物体抽出のための領域を決定している. さらに, 求めた領域をすでに提案されているファジイ推論を用いた物体抽出法に適用し, 物体抽出結果が向上することを確認する., 一般社団法人電子情報通信学会, 日本語
  • 複数経由点指定を伴う経路探索に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 429, 69, 74, 1997年12月11日
    本稿は, 遺伝的アルゴリズム(GA)を用いた複数経由点指定を伴う経路探索手法を提案する. 本手法は, 最短経路を選択するだけでなく, 指定された複数のノードを経由する最短経路を探索することが可能である. Dijkstra法をはじめとする従来法は, 最短経路のみを求めるアルゴリズムであり, 経由点を通る経路を求めるには, すべての経由点の通過する順序を考慮に入れて探索を行う必要がある. それゆえ, 最短経路を決定するためには, 経由点数の2乗のオーダの回数の経路探索を行わなければならない. 経由点の数が多くなると, これら全経由点を通過する最短経路の探索は多くの計算量を伴う. 本手法は, 一回の探索ですべての経由点を通る最短経路を求められる点で有効である., 一般社団法人電子情報通信学会, 日本語
  • 画像符号化におけるエッジ保存を考慮した適応KL基底
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 427, 45, 49, 1997年12月11日
    エッジの性質を反映した適応KL基底を用いた画像符号化を行なう. 画像中の小画像(実際には固定サイズのブロック)に存在するエッジの方向でブロックをクラス分類し, そのクラスの特性を反映した適応KL基底を設計する. 実際には, 画像を高周波成分と低周波成分に分解したうえで, エッジ画像(高周波成分)に対して適応KL基底を設計し, 符号化を行なう. そして, 固定基底である離散コサイン変換(以後DCT)と比較し, その有効性を検討する., 一般社団法人電子情報通信学会, 日本語
  • 動きテーブル参照による動き補償方式に関する考察
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 427, 51, 56, 1997年12月11日
    本文は, 動画像符号化のための新しい動き補償方式を提案する. 提案手法では, 符号化システムの設計の時点で, 様々な動きを格納した動きテーブルを作成する. 提案手法により動き補償予測を行なう時には, 対象ブロック毎に動きテーブルを探索し, 各ブロック内の画素値の動き補償予測誤差を最小にする動きを選択し動き補償予測を行なう. 動きテーブルの2種類の作成法について説明し, 作成法の違いによる再生画像への影響を実験結果を示し, 考察する., 一般社団法人電子情報通信学会, 日本語
  • フラクタル次元を用いた画素補間法に関する考察
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 427, 57, 62, 1997年12月11日
    本文では, フラクタル次元を用いた自然画像に対する画像補間法について提案する. 画像の拡大を行う場合等に用いられることの多い線形補間やスプライン補間では, 画像の高周波成分か失われ, これが補間後の画像の誤差原因となる. そこで, 本手法では, 補間対象となる画像からフラクタル次元を推定し, これを利用する事で画像の持つフラクタル性を利用し, 線形補間などの従来法に比べ誤差が少ない補間を行う. これは, フラクタル次元と人間の知覚する粗さの尺度と強い相関があることを利用している. これまで, 画像のフラクタル次元から, 複雑な形状を生成しようとする試みは, 地形・山岳データに対しては盛んに行われてきた. 本文では, これまで主に山岳データの補間に用いられてきたフラクタル疑似補間法に変更を加え, 人物像等の自然画像に対して適用する., 一般社団法人電子情報通信学会, 日本語
  • ファジィ推論を用いた物体抽出のための効果的な初期領域の決定法
    新井 哲也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 427, 63, 68, 1997年12月11日
    本文では, 動画像からの物体抽出に適した領域分割法を提案する. 本手法では画像を単純領域拡張法によって領域分割し, 各々の領域の重心を用いてk-平均クラスタリングを行ない物体抽出のための領域を決定している. さらに, 求めた領域をすでに提案されているファジイ推論を用いた物体抽出法に適用し, 物体抽出結果が向上することを確認する., 一般社団法人電子情報通信学会, 日本語
  • 複数経由点指定を伴う経路探索に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 97, 427, 69, 74, 1997年12月11日
    本稿は, 遺伝的アルゴリズム(GA)を用いた複数経由点指定を伴う経路探索手法を提案する. 本手法は, 最短経路を選択するだけでなく, 指定された複数のノードを経由する最短経路を探索することが可能である. Dijkstra法をはじめとする従来法は, 最短経路のみを求めるアルゴリズムであり, 経由点を通る経路を求めるには, すべての経由点の通過する順序を考慮に入れて探索を行う必要がある. それゆえ, 最短経路を決定するためには, 経由点数の2乗のオーダの回数の経路探索を行わなければならない. 経由点の数が多くなると, これら全経由点を通過する最短経路の探索は多くの計算量を伴う. 本手法は, 一回の探索ですべての経由点を通る最短経路を求められる点で有効である., 一般社団法人電子情報通信学会, 日本語
  • 画像符号化におけるエッジ保存を考慮した適応KL基底
    塚原 正人, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 77, 45, 49, 1997年12月11日
    エッジの性質を反映した適応KL基底を用いた画像符号化を行なう.画像中の小画像(実際には固定サイズのブロック)に存在するエッジの方向でブロックをクラス分類し, そのクラスの特性を反映した適応KL基底を設計する.実際には, 画像を高周波成分と低周波成分に分解したうえで, エッジ画像(高周波成分)に対して適応KL基底を設計し, 符号化を行なう.そして, 固定基底である離散コサイン変換(以後DCT)と比較し, その有効性を検討する., 一般社団法人映像情報メディア学会, 日本語
  • 動きテーブル参照による動き補償方式に関する考察
    浅水 仁, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 77, 51, 56, 1997年12月11日
    本文は, 動画像符号化のための新しい動き補償方式を提案する.提案手法では, 符号化システムの設計の時点で, 様々な動きを格納した動きテーブルを作成する.提案手法により動き補償予測を行なう時には, 対象ブロック毎に動きテーブルを探索し, 各ブロック内の画素値の動き補償予測誤差を最小にする動きを選択し動き補償予測を行なう.動きテーブルの2種類の作成法について説明し, 作成法の違いによる再生画像への影響を実験結果を示し, 考察する., 一般社団法人映像情報メディア学会, 日本語
  • フラクタル次元を用いた画素補間法に関する考察
    本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 77, 57, 62, 1997年12月11日
    本文では, フラクタル次元を用いた自然画像に対する画像補間法について提案する.画像の拡大を行う場合等に用いられることの多い線形補間やスプライン補間では, 画像の高周波成分が失われ, これが補間後の画像の誤差原因となる.そこで, 本手法では, 補間対象となる画像からフラクタル次元を推定し, これを利用する事で画像の持つフラクタル性を利用し, 線形補間などの従来法に比べ誤差が少ない補間を行う.これは, フラクタル次元と人間の知覚する粗さの尺度と強い相関があることを利用している.これまで, 画像のフラクタル次元から, 複雑な形状を生成しようとする試みは, 地形・山岳データに対しては盛んに行われてきた.本文では, これまで主に山岳データの補間に用いられてきたフラクタル疑似補間法に変更を加え, 人物像等の自然画像に対して適用する., 一般社団法人映像情報メディア学会, 日本語
  • ファジィ推論を用いた物体抽出のための効果的な初期領域の決定法
    新井 哲也, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 77, 63, 68, 1997年12月11日
    本文では, 動画像からの物体抽出に適した領域分割法を提案する.本手法では画像を単純領域拡張法によって領域分割し, 各々の領域の重心を用いてk-平均クラスタリングを行ない物体抽出のための領域を決定している.さらに, 求めた領域をすでに提案されているファジィ推論を用いた物体抽出法に適用し, 物体抽出結果が向上することを確認する., 一般社団法人映像情報メディア学会, 日本語
  • 複数経由点指定を伴う経路探索に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 77, 69, 74, 1997年12月11日
    本稿は, 遺伝的アルゴリズム(GA)を用いた複数経由点指定を伴う経路探索手法を提案する.本手法は, 最短経路を選択するだけでなく, 指定された複数のノードを経由する最短経路を探索することが可能である.Dijkstra法をはじめとする従来法は, 最短経路のみを求めるアルゴリズムであり, 経由点を通る経路を求めるには, すべての経由点の通過する順序を考慮に入れて探索を行う必要がある.それゆえ, 最短経路を決定するためには, 経由点数の2乗のオーダの回数の経路探索を行わなければならない.経由点の数が多くなると, これら全経由点を通過する最短経路の探索は多くの計算量を伴う.本手法は, 一回の探索ですべての経由点を通る最短経路を求められる点で有効である., 一般社団法人映像情報メディア学会, 日本語
  • カルマンフィルタによる高精度画像復元のための画像のモデリングとパラメータ推定
    城 崇, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理, 80, 11, 2912, 2919, 1997年11月25日
    より高精度な画像復元を可能とするためにカルマンフィルタによる画像復元アルゴリズムを提案する. カルマンフィルタを用いて画像復元を行う場合, 原画像のモデリングは復元精度を左右する重要な要素であり, 画像の種類や観測画像の劣化の程度によって良好な復元を行うことができるモデルは変わってくる. また, カルマンフィルタを実現する際には, 原画像の相関や雑音の分散などのパラメータが必要とされる. 従ってこれらのパラメータが未知である場合には, 観測画像から推定しなければならない. 以上の問題を解決するために, 画素値を推定するために用いる画素数とそれらの位置を決定する方法および未知パラメータが存在する際にこれらを復元過程に組み込んで推定する方法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 磁気力顕微鏡像の解析
    武隈 育子, 熊谷 政輝, 安井 雅彦, 奥村 善信, 秋田 憲, 前田 誠, 末岡 和久, 長谷山 美紀, 武笠 幸一, 日本応用磁気学会学術講演概要集 = Digest of ... annual conference on magnetics in Japan, 21, 1, 1, 1997年10月01日
    日本語
  • Inherent matrix identities on ARMA lattice filter realization algorithm and their application
    M Haseyama, H Kitajima, IEEE TRANSACTIONS ON SIGNAL PROCESSING, 45, 9, 2395, 2398, 1997年09月
    This correspondence presents the matrix identities that are inherent in the solution of the normal equations for an ARMA lattice filter. This derivation also makes clear the relationship between the recursive least squares (RLS) method and the ARMA lattice filter realization algorithm. Further, as an application of the matrix identities, a new method for model identification with frequency weighting (MIFW) is presented., IEEE-INST ELECTRICAL ELECTRONICS ENGINEERS INC, 英語
  • Inherent matrix identities on ARMA lattice filter realization algorithm and their application
    Miki Haseyama, Hideo Kitajima, IEEE Transactions on Signal Processing, 45, 9, 2395, 2398, 1997年09月
    This correspondence presents the matrix identities that are inherent in the solution of the normal equations for an ARMA lattice filter. This derivation also makes clear the relationship between the recursive least squares (RLS) method and the ARMA lattice filter realization algorithm. Further, as an application of the matrix identities, a new method for model identification with frequency weighting (MIFW) is presented., IEEE, 英語
  • Image restoration method with multiframe projection filter
    Manabu Kikuchi, Miki Haseyama, Hideo Kitajima, Systems and Computers in Japan, 28, 7, 65, 74, 1997年06月30日
    In this paper, we propose a multiframe projection filter (MFPF) that restores images using several observed images rather than one observed image by enhancing a conventional projection filter. By superimposing several observed images during image restoration, the MFPF reduces random noise. Use of the MFPF enables high-quality image restoration when several observed images of a specified object are available. Since image selection is crucial to the process of superimposition, we also propose a selection equation. The MFPF differs from the multiframe Wiener filter (MFWF), which also uses several observed images, in that it does not require original image correlation numbers during image restoration. Because the MFPF does not require such numbers, the MFPF offers superior image restoration in cases where the original image cannot be elucidated from observed images. At the end of this paper, we present summary findings from an image restoration experiment carried out using the proposed filter. But first, we will confirm the MFPF's effectiveness in superimposing images and give an example of a situation where, given the absence of an original image, the MFPF provides better image resolution than the MFWF. Finally, combining a method for estimating background noise dispersion and an equation for selecting which images to use for superimposition results in an image restoration system capable of functioning when random noise dispersion is unknown. Following the above scheme will confirm the effectiveness of our approach. © 1997 Scripta Technica, Inc.
  • CORDICアルゴリズムを用いた規格化ARMAラチスフィルタの実現法に関する一考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 97, 136, 17, 24, 1997年06月26日
    本文ではCORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する手法を提案する. CORDICアルゴリズムを用いた規格化ラチスフィルタの実現法としてCALFアルゴリズムが提案されている. しかしながら, 回転角の収束値, 収束速度の二点において問題があり, CALFアルゴリズムを拡張し, 規格化ARMAラチスフィル夕を実現することは困難である. そこで, 本文ではこの問題を改善し, CORDIC ARMAラチスフィルタの実現を可能とする手法を提案する. 本文で提案するフィルタは, CALF同様, 特化したCORDICアルゴリズムを用いて構成されるため, VLSIでの効果的な実現が可能である. さらに, このフィルタは入力信号の推定を行いながらフィルタリングを行うことにより, 入力信号が未知の場合にも用いることができる. 本文の最後では実験により, 提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • パルス性雑音による劣化画像の復元に関する考察
    一岡 美佳子, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 97, 136, 25, 30, 1997年06月26日
    本文では, IFS(Iterated Function System)を用いたパルス性雑音による劣化画像の復元法を考察する. 単独で現れるパルス性雑音に対する復元法の一つにメディアンフィルターが提案されている. また, 集中して現れるパルス性雑音によって劣化した画像の復元法の一つとして線形補間法が提案されている. しかし, これらの復元法では, 画像全体がぼやけてしまったり, 高周波成分を保ったままで復元したい部分を滑らかに復元してしまうことがある. それに対して本文で提案するIFSによる復元法では, 画像の複雑さを保持しながら復元を行うという利点がある., 一般社団法人電子情報通信学会, 日本語
  • ファジィ推論を用いた動画像からの物体抽出に関する考察
    新井 哲也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 97, 136, 31, 36, 1997年06月26日
    本論文ではファジィ推論を用いて動画像から物体を抽出する手法を提案する. 本手法は画像を小領域に分割した後, 物体に含まれる領域をその動きと位置から定義される関係に基づいて統合することによって物体を抽出している. この際の領域統合の判断はファジィ推論を用いて行われている. さらに, 複数のフレームを用いることで, 高精度な物体抽出を可能とするために回帰型ファジィ推論を導入している., 一般社団法人電子情報通信学会, 日本語
  • GA経路探索における複数解候補の決定に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 97, 136, 37, 42, 1997年06月26日
    本文は遺伝的アルゴリズム(GA)を用いた経路探索手法を提案する. 提案手法は, 最短経路を選択するだけでなく, GAの特徴を生かし最短経路に準ずる複数の解候補の決定が可能である. 従って本手法を用いれば, 最適経路とユーザの希望する経路が一致しない場合でも, 新たに探索し直すことなく他の経路候補を得ることが可能となる. このような応用は従来法では容易に実現することができない. さらに提案手法は, 地理的情報から重みを遺伝子型に組み込むことにより, 経路長が短く, かつ経由するノードが類似しない経路を決定することが可能である., 一般社団法人電子情報通信学会, 日本語
  • CORDICアルゴリズムを用いた規格化ARMAラチスフィルタの実現法に関する一考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 97, 140, 17, 24, 1997年06月26日
    本文ではCORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する手法を提案する. CORDICアルゴリズムを用いた規格化ラチスフィルタの実現法としてCALFアルゴリズムが提案されている. しかしながら, 回転角の収束値, 収束速度の二点において問題があり, CALFアルゴリズムを拡張し, 規格化ARMAラチスフィル夕を実現することは困難である. そこで, 本文ではこの問題を改善し, CORDIC ARMAラチスフィルタの実現を可能とする手法を提案する. 本文で提案するフィルタは, CALF同様, 特化したCORDICアルゴリズムを用いて構成されるため, VLSIでの効果的な実現が可能である. さらに, このフィルタは入力信号の推定を行いながらフィルタリングを行うことにより, 入力信号が未知の場合にも用いることができる. 本文の最後では実験により, 提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • パルス性雑音による劣化画像の復元に関する考察
    一岡 美佳子, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 97, 140, 25, 30, 1997年06月26日
    本文では, IFS(Iterated Function System)を用いたパルス性雑音による劣化画像の復元法を考察する. 単独で現れるパルス性雑音に対する復元法の一つにメディアンフィルターが提案されている. また, 集中して現れるパルス性雑音によって劣化した画像の復元法の一つとして線形補間法が提案されている. しかし, これらの復元法では, 画像全体がぼやけてしまったり, 高周波成分を保ったままで復元したい部分を滑らかに復元してしまうことがある. それに対して本文で提案するIFSによる復元法では, 画像の複雑さを保持しながら復元を行うという利点がある., 一般社団法人電子情報通信学会, 日本語
  • ファジィ推論を用いた動画像からの物体抽出に関する考察
    新井 哲也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 97, 140, 31, 36, 1997年06月26日
    本論文ではファジィ推論を用いて動画像から物体を抽出する手法を提案する. 本手法は画像を小領域に分割した後, 物体に含まれる領域をその動きと位置から定義される関係に基づいて統合することによって物体を抽出している. この際の領域統合の判断はファジィ推論を用いて行われている. さらに, 複数のフレームを用いることで, 高精度な物体抽出を可能とするために回帰型ファジィ推論を導入している., 一般社団法人電子情報通信学会, 日本語
  • GA経路探索における複数解候補の決定に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. DSP, ディジタル信号処理, 97, 140, 37, 42, 1997年06月26日
    本文は遺伝的アルゴリズム(GA)を用いた経路探索手法を提案する. 提案手法は, 最短経路を選択するだけでなく, GAの特徴を生かし最短経路に準ずる複数の解候補の決定が可能である. 従って本手法を用いれば, 最適経路とユーザの希望する経路が一致しない場合でも, 新たに探索し直すことなく他の経路候補を得ることが可能となる. このような応用は従来法では容易に実現することができない. さらに提案手法は, 地理的情報から重みを遺伝子型に組み込むことにより, 経路長が短く, かつ経由するノードが類似しない経路を決定することが可能である., 一般社団法人電子情報通信学会, 日本語
  • CORDICアルゴリズムを用いた規格化ARMAラチスフィルタの実現法に関する一考察
    白石 真一, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 97, 138, 17, 24, 1997年06月26日
    本文ではCORDICアルゴリズムを用いて規格化ARMAラチスフィルタを実現する手法を提案する. CORDICアルゴリズムを用いた規格化ラチスフィルタの実現法としてCALFアルゴリズムが提案されている. しかしながら, 回転角の収束値, 収束速度の二点において問題があり, CALFアルゴリズムを拡張し, 規格化ARMAラチスフィル夕を実現することは困難である. そこで, 本文ではこの問題を改善し, CORDIC ARMAラチスフィルタの実現を可能とする手法を提案する. 本文で提案するフィルタは, CALF同様, 特化したCORDICアルゴリズムを用いて構成されるため, VLSIでの効果的な実現が可能である. さらに, このフィルタは入力信号の推定を行いながらフィルタリングを行うことにより, 入力信号が未知の場合にも用いることができる. 本文の最後では実験により, 提案手法の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • パルス性雑音による劣化画像の復元に関する考察
    一岡 美佳子, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 97, 138, 25, 30, 1997年06月26日
    本文では, IFS(Iterated Function System)を用いたパルス性雑音による劣化画像の復元法を考察する. 単独で現れるパルス性雑音に対する復元法の一つにメディアンフィルターが提案されている. また, 集中して現れるパルス性雑音によって劣化した画像の復元法の一つとして線形補間法が提案されている. しかし, これらの復元法では, 画像全体がぼやけてしまったり, 高周波成分を保ったままで復元したい部分を滑らかに復元してしまうことがある. それに対して本文で提案するIFSによる復元法では, 画像の複雑さを保持しながら復元を行うという利点がある., 一般社団法人電子情報通信学会, 日本語
  • ファジィ推論を用いた動画像からの物体抽出に関する考察
    新井 哲也, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 97, 138, 31, 36, 1997年06月26日
    本論文ではファジィ推論を用いて動画像から物体を抽出する手法を提案する. 本手法は画像を小領域に分割した後, 物体に含まれる領域をその動きと位置から定義される関係に基づいて統合することによって物体を抽出している. この際の領域統合の判断はファジィ推論を用いて行われている. さらに, 複数のフレームを用いることで, 高精度な物体抽出を可能とするために回帰型ファジィ推論を導入している., 一般社団法人電子情報通信学会, 日本語
  • GA経路探索における複数解候補の決定に関する考察
    稲垣 潤, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 97, 138, 37, 42, 1997年06月26日
    本文は遺伝的アルゴリズム(GA)を用いた経路探索手法を提案する. 提案手法は, 最短経路を選択するだけでなく, GAの特徴を生かし最短経路に準ずる複数の解候補の決定が可能である. 従って本手法を用いれば, 最適経路とユーザの希望する経路が一致しない場合でも, 新たに探索し直すことなく他の経路候補を得ることが可能となる. このような応用は従来法では容易に実現することができない. さらに提案手法は, 地理的情報から重みを遺伝子型に組み込むことにより, 経路長が短く, かつ経由するノードが類似しない経路を決定することが可能である., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いた動画像符号化のための動きパラメータ決定
    浅水 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 123, 1, 6, 1997年06月20日
    本文は、動き補償予測符号化における動きパラメータを遺伝的アルゴリズムによる決定手法を提案する。従来はLBGアルゴリズムを用いて動きパラメータを量子化するため、量子化誤差が再生画像に与えてしまうという問題があった。この影響を軽減するために本手法は、再生画像に与える影響を考慮しながら、遺伝的アルゴリズムを用いて、動きパラメータを決定する。本文では、提案アルゴリズムを用いた動きパラメータ決定の実験結果を示し、有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • コラージュ定理の拡張に関する一考察
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 97, 123, 7, 12, 1997年06月20日
    IFSによるフラクタル画像符号化では, コラージュ定理に基づいて写像のパラメータ決定を行う. このコラージュ定理は, コラージュ (縮小写像の張り合わせ) が原画像の良好な近似になっていれば, 写像の反復によって得られる再生画像は原画像の良好な近似になるという定理である. しかし, この定理では, 再生画像の誤差が必ずコラージュの誤差よりも小さくなることを保証しているのではなく, 条件によっては誤差が大きくなることがある. そこで, 本文ではこの影響を削減するために, 反復回数を指定した拡張コラージュ定理を提案する. この拡張コラージュ定理に従う方式では複数回の反復でパラメータを決定することで再生画像の誤差削減をはかる事が可能となる. さらに, このパラメータを用いて画像再生を行う場合には, 写像反復回数はパラメータ決定時の反復回数と同じでよく, それ以上の反復は不必要であり, 必要以上の反複写像を行うと誤差が大きくなることを実験により示す., 一般社団法人電子情報通信学会, 日本語
  • 1)量子化誤差も考慮したIFSパラメータの量子化法に関する考慮(放送方式研究会)
    本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 342, 343, 1997年03月20日
    一般社団法人映像情報メディア学会, 日本語
  • 2)動画像のフレーム間予測誤差信号のベクトル量子化法に関する一考察(放送方式研究会)
    金森 紀文, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 343, 343, 1997年03月20日
    一般社団法人映像情報メディア学会, 日本語
  • 3)GAとMRFモデルを用いた画像の領域分割(放送方式研究会)
    宮本 俊洋, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 343, 343, 1997年03月20日
    一般社団法人映像情報メディア学会, 日本語
  • 4)定ブロックサイズIFSにおける相似領域検索法に関する考察(放送方式研究会)
    伊藤 進策, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 343, 343, 1997年03月20日
    一般社団法人映像情報メディア学会, 日本語
  • 5)整数論的アダマール変換を用いた静止画像のロスレス符号化(放送方式研究会)
    星野 亮, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 343, 343, 1997年03月20日
    一般社団法人映像情報メディア学会, 日本語
  • 6)遺伝的アルゴリズムを用いたフラクタルブロック符号化に関する一考察(放送方式研究会)
    小林 亜令, 本多 博之, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会誌 : 映像情報メディア, 51, 3, 343, 343, 1997年03月20日
    一般社団法人映像情報メディア学会, 日本語
  • 整数信号のアダマール変換の解析
    北島 秀夫, 星野 亮, 長谷山 美紀, 下野 哲雄, 電子情報通信学会総合大会講演論文集, 1997, 2, 49, 49, 1997年03月06日
    This paper analyzes properties of Hadamard transforms of integer signals with intended applications in lossless image coding. It is shown that the vectors holding Hadamard transform coefficients of integer signals form a small subset of integer vectors if they are mapped onto an integer ring modulo the transform size., 一般社団法人電子情報通信学会, 英語
  • 仮想参照信号を用いた能動騒音制御
    秋保 政一, 長谷山 美紀, 北島 秀夫, 日本音響学会研究発表会講演論文集, 1997, 2, 819, 820, 1997年03月01日
    日本語
  • パターン識別を用いた動画像のカット点検出に関する一考察
    槇 宏晃, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 96, 508, 47, 52, 1997年02月04日
    本文はパターン識別を用いた動画像のカット点検出法の改善策を提案する。 従来のパターン識別によるカット点の検出法は、画像を領域分割し、領域のクラス分けを行う。そのクラスの消滅からカット点を検出するものである。しかしパターン識別が画像内の物体の動きの影響を受けやすいという間題点があった。このような問題を解決するために、本文ではパターン識別の際に領域の移動・大きさを考慮にいれることにより評価値の向上を図る。さらに提案手法を用いたカット点検出の結果を示し、有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • パターン識別を用いた動画像のカット点検出に関する一考察
    槇 宏晃, 長谷山 美紀, 北島 秀夫, 映像情報メディア学会技術報告, 21, 7, 47, 52, 1997年02月04日
    本文はパターン識別を用いた動画像のカット点検出法の改善策を提案する。従来のパターン識別によるカット点の検出法は、画像を領域分割し、領域のクラス分けを行う。そのクラスの消滅からカット点を検出するものである。しかしパターン識別が画像内の物体の動きの影響を受けやすいという問題点があった。このような問題を解決するために、本文ではパターン識別の際に領域の移動・大きさを考慮にいれることにより評価値の向上を図る。さらに提案手法を用いたカット点検出の結果を示し、有効性を確認する。, 一般社団法人映像情報メディア学会, 日本語
  • 適応ウィーナーフィルタによる加法性白色雑音除去
    塚原正人, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • フラクタル次元を考慮した画像補間法に関する考察
    本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • ファジィ推論を用いた物体抽出を行なうためのカラー画像の利用
    新井哲也, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 動きテーブル参照による高精度動き補償方式
    浅水仁, 吉田仁, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 領域分割を利用したカルマンフィルタ画像復元に関する考察
    熊谷政輝, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 高精度なカット点検出を目的とする音声データの利用
    薄田隆博, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • IFSを用いた画像復元に関する一考察
    一岡美佳子, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 領域分割を用いたカット点検出法における評価式の改善
    槙宏晃, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 遺伝的アルゴリズムを用いたIFSパラメータ決定の高速化
    小林亜令, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 整数論的アダマール変換を用いた静止画像の可逆符号化および準可逆符号化
    星野亮, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • GA経路探索における複数解候補の決定法
    稲垣潤, 長谷山美紀, 北島秀夫, 利部直, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • CORDIC ARMAラチスフィルタの実現法に関する一考察
    白石真一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 動画像符号化における3次元モデルを用いた動き補償予測
    小池理一郎, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 形状識別を目的とした複素ARXモデルに関する考察
    長谷山美紀, 秋保政一, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • 遺伝的アルゴリズムを用いた対応点探索
    武藤剛史, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1997, 1997年
  • ARMA direct form filter designing method to reconstruct FIR digital filters based upon genetic algorithm and simulated annealing
    Masaichi Akiho, Miki Haseyama, Hideo Kitajima, Journal of the Acoustical Society of Japan (E) (English translation of Nippon Onkyo Gakkaishi), 18, 4, 153, 161, 1997年
    In this paper, the method for reconstructing FIR digital filter into ARMA direct form digital filter based upon adaptive ARMA Four Line Lattice filter with the phase estimation is proposed. The phase estimation is performed by the combination of GA (Genetic Algorithm) and SA (Simulated Annealing) in addition to the spectrum estimation. In order to reduce the calculation cost that will be significant issue for the system implementation of digital filters into the products, it will be necessary to design ARMA digital filter. Introducing the phase estimation method, it contributes the possibility to provide optimum ARMA digital filters that is not only relatively lower coefficient sensitivity and better robustness, but also it will maintain all its desired characteristics that include the phase performance. Maintaining the phase characteristics is the unforgettable factor for the fields of the inverse filtering problem for any opportunities. We conduct the original cost function that will cooperate with GA and SA searching in order to realize the phase estimation. In this paper, experimental results are also discussed to confirm the performance of proposed method., Acoustical Soc Jpn, 英語
  • A realization method of an ARMAX lattice filter
    Miki Haseyama, Hideo Kitajima, IEEE Transactions on Signal Processing, 45, 2, 471, 476, 1997年
    This correspondence proposes a realization method of an ARMAX lattice filter for frequency-weighting ARMAX model identification. The proposed lattice filter uses an exponentially weighted sliding window for the same application as the extended least squares (ELS) achieves. Based on the proposed structure, the algorithm can perform the frequency-weighting model identification more easily than the ELS. Further, applied to the ARMAX model identification, the proposed algorithm requires fewer multiplications than the ELS does. © 1997 IEEE., Institute of Electrical and Electronics Engineers Inc., 英語
  • Extension of the collage theorem
    H Honda, M Haseyama, H Kitajima, S Matsumoto, INTERNATIONAL CONFERENCE ON IMAGE PROCESSING - PROCEEDINGS, VOL II, 2, 306, 309, 1997年
    Fractal image compression using the IFS is based on the collage theorem proposed by M. F. Barnsley. In this conventional method, the errors between the reconstructed image and original image may be greater than the errors between the collage and original image because the collage theorem does not guarantee the former errors to be smaller than the latter errors. This paper proposes an extended collage theorem. An IFS algorithm based on this theorem determines the parameters after iterations of the contraction mappings. An image reconstructed according to the new theorem has higher quality than one based on the existing collage theorem. The reconstructed image can be gotten by fewer iterations than by the conventional IFS., I E E E, COMPUTER SOC PRESS, 英語
  • Residue-based classification of Hadamard transforms of integer signals
    H Kitajima, M Hoshino, M Haseyama, DSP 97: 1997 13TH INTERNATIONAL CONFERENCE ON DIGITAL SIGNAL PROCESSING PROCEEDINGS, VOLS 1 AND 2, 1, 357, 359, 1997年
    This paper discusses, the classification of Hadamard transform coefficients. It is shown that the coefficient vectors can be classified into a small number of residue classes for a modulus equal to an integer power of 2. It is suggested that the result can be used to define an efficient product code for lossless coding of digital images., I E E E, 英語
  • 量子化誤差を考慮したIFSパラメータの量子化法に関する考察
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 96, 402, 1, 6, 1996年12月13日
    一般にIFS (Iterated Function System)による画像符号化では, IFSパラメータを決定したのち,量子化・符号化を行う.しかし,量子化の際に生じる量子化誤差が再生画像に多大な影響を及ぼしてしまうことが実験によって確認されている.そこで,本文においては,この量子化誤差の影響の削減をはかるため,IFSパラメータの量子化方法について再検討を行う.ここでは,パラメータ決定後に量子化を行うのではなく,量子化を行いつつパラメータ決定を行うことにより量子化誤差の再生画像への影響の削減をはかる., 一般社団法人電子情報通信学会, 日本語
  • 動画像のフレーム間予測誤差信号のベクトル量子化法に関する一考察
    金森 紀文, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 96, 402, 7, 12, 1996年12月13日
    本文は動画像符号化の手法として,閥値処理を導入したフレーム間予測誤差信号のべクトル量子化を提案する.閥値処理によって予測誤差の大きな部分と小さな部分とに分け,これらを学習系列として別個にベクトル量子化器の設計を行う.量子化の対象となる予測誤差信号についても同様に間借処理を行い,ベクトル量子化を行う.動き補償予測においては,動きテーブル参照による方式を用いる.動きの代表的パターンを動きテーブルに格納しておき,対象ブロックごとに動きテーブルを検索し,動き補償予測誤差を最小にする動きパターンを求める.動きテーブル参照による動き補償予測方式と,閥値処理を導入した予測誤差信号のべクトル量子化とを組み合わせることによって高能率符号化を図る., 一般社団法人電子情報通信学会, 日本語
  • GAとMRFモデルを用いた画像の領域分割
    宮本 俊洋, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 96, 402, 13, 18, 1996年12月13日
    本文は画像の領域分割に遺伝的アルゴリズム(GA)を適用した手法を提案する.従来のマルコフ確率場(MRF)モデルを用いた領域分割法は領域内で滑らかに画素値の変化する領域には対応できず,また領域数が既知である事が要求される.それを解決する為に提案手法ではGAを用いて様々なパラメータ,領域毎の情報を推定し,従来法では対応しきれなかった画像を領域分割する.本文ではまず画像の領域分割にGAを適用する為のパラメータを設定する.さらに提案アルゴリズムを用いた領域分割のシミュレーション結果を示し,有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 定ブロックサイズIFSにおける相似領域検索法に関する考察
    伊藤 進策, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 96, 402, 19, 24, 1996年12月13日
    IFSにおいてブロックサイズを固定した場合,符号量を抑えられるという利点があるが,ブロックサイズを大きくした際に細部をうまく表現できないという欠点もある.本稿では,IFSによる再生画像のブロック毎のMSE と原画像の対応するブロックの分散の相関が高いことを説明し,その性質を利用して,あらかじめプロッタを分散により分類し,分散の小さいプロッタについては大まかに,分散の大きいブロックについては細かく相似領域の検索を行なうことにより,符号量の増加を抑えながら,画質の向上をはかる手法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 整数論的アダマール変換を用いた静止画像のロスレス符号化
    星野 亮, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 96, 402, 25, 30, 1996年12月13日
    本文は整数論的アダマール変換を用いた静止画像のロスレス符号化法を提案する.アダマール変換を法演算に拡張する事で得られる整数論的アダマール変換は計算される変換係数が整数のみであり,またその取りうる値の総数は法以下に抑えられるので符号化の際に有利になる.この変換を用いてロスレス符号化を行う.さらに,最下位ビットの統計的性質の利用,画素値の再マッピング処理などを用いて符号量を削減する.また,原画像の加工と組み合わせた準ロスレス符号化法を提案する., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いたフラクタルブロック符号化に関する一考察
    小林 亜令, 本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CS, 通信方式, 96, 402, 31, 36, 1996年12月13日
    本文よフラクタルプロツク符号化法におけるスケーリングパラメータの遺伝的アルゴリズムによる決定手法を提案する.従来は最小二乗法でスケーリングパラメータを決定した後,量子化していたために再生時に反復回数を増やすにつれて量子化誤差の影響が増加してしまうという問題があった.このような問題を解決するために本手法は遺伝的アルゴリズムを用いてスケーリングパラメータを決定している.本文ではまずスケーリンダパラメータ決定に遺伝的アルゴリズムを応用する際の設定を示す.さらに提案アルゴリズムを用いたスケーリンダパラメータ決定の結果を示し,有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 量子化誤差を考慮したIFSパラメータの量子化法に関する考察
    本多 博之, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 70, 1, 6, 1996年12月13日
    一般にIFS(Iterated Function System)による画像符号化では, IFSパラメータを決定したのち, 量子化・符号化を行う.しかし, 量子化の際に生じる量子化誤差が再生画像に多大な影響を及ぼしてしまうことが実験によって確認されている.そこで, 本文においては, この量子化誤差の影響の削減をはかるため, IFSパラメータの量子化方法について再検討を行う.ここでは, パラメータ決定後に量子化を行うのではなく, 量子化を行いつつパラメータ決定を行うことにより量子化誤差の再生画像への影響の削減をはかる., 一般社団法人映像情報メディア学会, 日本語
  • 動画像のフレーム間予測誤差信号のベクトル量子化法に関する一考察
    金森 紀文, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 70, 7, 12, 1996年12月13日
    本文は動画像符号化の手法として、閾値処理を導入したフレーム間予測誤差信号のベクトル量子化を提案する。閾値処理によって予測誤差の大きな部分と小さな部分とに分け、これらを学習系列として別個にベクトル量子化器の設計を行う。量子化の対象となる予測誤差信号についても同様に閾値処理を行い、ベクトル量子化を行う。動き補償予測においては、動きテーブル参照による方式を用いる。動きの代表的パターンを動きテーブルに格納しておき、対象ブロックごとに動きテーブルを検索し、動き補償予測誤差を最小にする動きパターンを求める。動きテーブル参照による動き補償予測方式と、閾値処理を導入した予測誤差信号のベクトル量子化とを組み合わせることによって高能率符号化を図る。, 一般社団法人映像情報メディア学会, 日本語
  • GAとMRFモデルを用いた画像の領域分割
    宮本 俊洋, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 70, 13, 18, 1996年12月13日
    本文は画像の領域分割に遺伝的アルゴリズム(GA)を適用した手法を提案する。従来のマルコフ確率場(MRF)モデルを用いた領域分割法は領域内で滑らかに画素値の変化する領域には対応できず、また領域数が既知である事が要求される。それを解決する為に提案手法ではGAを用いて様々なパラメータ、領域毎の情報を推定し、従来法では対応しきれなかった画像を領域分割する。本文ではまず画像の領域分割にGAを適用する為のパラメータを設定する。さらに提案アルゴリズムを用いた領域分割のシミュレーション結果を示し、有効性を確認する。, 一般社団法人映像情報メディア学会, 日本語
  • 定ブロックサイズIFSにおける相似領域検索法に関する考察
    伊藤 新策, 本多 博之, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 70, 19, 24, 1996年12月13日
    IFSにおいてブロックサイズを固定した場合、符号量を抑えられるという利点があるが、ブロックサイズを大きくした際に細部をうまく表現できないという欠点もある。本稿では、IFSによる再生画像のブロック毎のMSEと原画像の対応するブロックの分散の相関が高いことを説明し、その性質を利用して、あらかじめブロックを分散により分類し、分散の小さいブロックについては大まかに、分散の大きいブロックについては細かく相似領域の検索を行なうことにより、符号量の増加を抑えながら、画質の向上をはかる手法を提案する。, 一般社団法人映像情報メディア学会, 日本語
  • 整数論的アダマール変換を用いた静止画像のロスレス符号化
    星野 亮, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 70, 25, 30, 1996年12月13日
    本文は整数論的アダマール変換を用いた静止画像のロスレス符号化法を提案する。アダマール変換を法演算に拡張する事で得られる整数論的アダマール変換は計算される変換係数が整数のみであり、またその取りうる値の総数は法以下に抑えられるので符号化の際に有利になる。この変換を用いてロスレス符号化を行う。さらに、最下位ビットの統計的性質の利用、画素値の再マッピング処理などを用いて符号量を削減する。また、原画像の加工と組み合わせた準ロスレス符号化法を提案する。, 一般社団法人映像情報メディア学会, 日本語
  • 遺伝的アルゴリズムを用いたフラクタルブロック符号化に関する一考察
    小林 亜令, 本多 博之, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 70, 31, 36, 1996年12月13日
    本文はフラクタルブロック符号化法におけるスケーリングパラメータの遺伝的アルゴリズムによる決定手法を提案する。従来は最小二乗法でスケーリングパラメータを決定した後、量子化していたために再生時に反復回数を増やすにつれて量子化誤差の影響が増加してしまうという問題があった。このような問題を解決するために本手法は遺伝的アルゴリズムを用いてスケーリングパラメータを決定している。本文ではまずスケーリングパラメータ決定に遺伝的アルゴリズムを応用する際の設定を示す。さらに提案アルゴリズムを用いたスケーリングパラメータ決定の結果を示し、有効性を確認する。, 一般社団法人映像情報メディア学会, 日本語
  • A method quantizing filter coefficients with genetic algorithm and simulated annealing
    Miki Haseyama, Yoshihiro Aketa, Hideo Kitajima, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E79-A, 1130, 1134, 1996年12月01日
    In this paper, a quantization method which can keep the phase and gain characteristics of a reference filter is proposed. The proposed method uses a genetic algorithm and a simulated annealing algorithm. The objective function used in this method is described with two kinds of weighting functions for identifying the phase and gain characteristics respectively. Therefore, the quantization accuracy on the gain characteristic is independent of the accuracy on the phase characteristic. Further, the proposed algorithm can be applied to any types of filters, because the chromosome expresses only their coefficients values. The efficiency of the proposed algorithm is verified by some experiments.
  • A map matching method with the innovation of the Kalman filtering
    Takashi Jo, Miki Haseyama, Hideo Kitajima, IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences, E79-A, 1853, 1855, 1996年12月01日
    This letter proposes a map-matching method for automotive navigation systems. The proposed method utilizes the innovation of the Kalman filter algorithm and can achieve more accurate positioning than the correlation method which is generally used for the navigation systems. In this letter, the performance of the proposed algorithm is verified by some simulations.
  • マルチフレーム射影フィルタによる画像復元法
    菊池 学, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理, 79, 9, 1516, 1524, 1996年09月25日
    本論文では,射影フィルタを拡張し,1枚の観測画像だけではなく,相互に関連のある複数枚の観測画像を用いて画像復元を行うマルチフレーム射影フィルタ(MFPF)を提案する.MFPFは,観測画像の重ね合せによって,雑音を低減する効果を利用した画像復元フィルタである.本フィルタを用いれば,特定の物体を観測する場合に撮影された複数枚の観測画像により,高精度な画像復元が可能となる.更に,本文では,効果的に重ね合わせる観測画像を選択するために,判定式を提案している.MFPFは,複数枚の観測画像を利用するウィーナーフィルタ(MFWF)と異なり,画像復元を行う際に原画像の相関関数を必要としない.そのため,原画像の相関関数が未知であり,観測画像から原画像の相関関数を高精度に推定できない場合は,MFPFの復元精度がMFWFよりも良好となる.本文の最後に,提案フィルタによる画像復元実験の概要を説明する.まず,観測画像の重ね合せの効果を確認し,次に原画像の相関関数が未知の場合に,MFPFがMFWFよりも復元精度が良好となる復元例を示す.最後に,雑音の分散が未知の場合の画像復元システム例を,既存の雑音の分散推定方法と重ね合わせる観測画像の選択を行う判定式を用いて実現する.以上から,本手法の有効性が確認される., 一般社団法人電子情報通信学会, 日本語
  • コラージュ定理の再考察
    本多 博之, 長谷山 美紀, 北島 秀夫, 松本 修一, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 173, 173, 1996年09月18日
    反復関数システム(Iterated Function System:IFS)においては無限回の反復写像の後に得られるattractorを用いてパラメータ決定を行うのが理想的ではあるが,計算時間が膨大になるためにCollage定理に基づき1回の縮小写像により得られるCollageを用いパラメータ決定を行う場合がほとんどである.しかし,Collage定理は得られる再生画像が最良のものであることを保証していない.したがって,他により良い再生画像が得られるようなパラメータが存在していると考えられる.本文では,このようなCollage定理の問題点について述べ,さらにCollage定理の拡張を行い,IFSにおける影響について調べる., 一般社団法人電子情報通信学会, 日本語
  • 画像の局所的性質に応じた基底による画像表現に関する一考察
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 222, 222, 1996年09月18日
    KL変換は,MSEを最小にするという観点などから最も効率の良い変換であるが,その基底を求める計算の複雑さなどから,実用性に欠けると言われている.しかし,画像を小ブロックに分割し,その局所的性質に応じた基底を用意できることから変換効率などの向上が期待できる.なお,DCTは相関が非常に高いところでKLTと同等の性能を有するが,固定基底であり,ブロックの局所的性質に応じた基底とは言えない.そこで,本文ではブロックの性質に応じた基底を用いた場合の有効性を,DCTと比較して調べる。, 一般社団法人電子情報通信学会, 日本語
  • MRFモデルによる領域内表現に基づいた遺伝的アルゴリズムを用いた画像の領域分割
    宮本 俊洋, 長谷山 美紀, 北島 秀夫, 電子情報通信学会ソサイエティ大会講演論文集, 1996, 381, 381, 1996年09月18日
    画像を領域に分割する方法が、これまでいくつか提案されている。領域分割は間値処理によって領域を抽出している。間値を各部位ごとに求め、さらに滑らかに画素値の変化する領域にも対応する遺伝的アルゴリズム(Genetic Algorithm:以下GA)を用いた画像の領域分割手法が提案されている。しかしこれらの手法はテクスチュアを考慮に入れていないため、徴小領域が多く発生していた。本文では、テクスチュアに対応するために2次多項式及びマルコフ確立場(Markov Random Field;以下MRF)モデルによるテクスチュア表現に基づく遺伝的アルゴリズムを用いた画像の領城分割法を提案する。従来のMRFモデルを用いた領域分割法においては領域内で滑らかに画素値の変化する領域には対応できず、また領域数が既知である事が要求されるが、本手法はGAと組み合わせる事によりその問題を解決している。, 一般社団法人電子情報通信学会, 日本語
  • Image representation through gray-scale iterated function systems
    H Honda, M Haseyama, H Kitajima, SYSTEMS AND COMPUTERS IN JAPAN, 27, 9, 55, 62, 1996年08月
    Image representation using the random iterated function system (Random IFS) has a disadvantage in that it requires many iterations. This paper proposes image representation through a gray-scale iterated function system. This method requires fewer iterations and it earn obtain better images than the random IFS. The saving in iterations is realized first by the use of a deterministic method, whereas in the random IFS, each mapping is defined as a probablistic event, and it needs many iterations to satisfy the law of large numbers.
    In the proposed method, the reconstructed image converges faster than in the conventional method, and it is shown to yield better reconstructed images. Second, statistical characteristics of the IFS parameters are investigated to be used for further accelerating the IFS parameter search. The characteristics are shown to be stable among different images. Simulation results are included to demonstrate the effectiveness of the accelerated algorithm., SCRIPTA TECHNICA PUBL, 英語
  • A method quantizing filter coefficients with genetic algorithm and simulated annealing
    M Haseyama, Y Aketa, H Kitajima, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E79A, 8, 1130, 1134, 1996年08月
    In this paper, a quantization method which can keep the phase and gain characteristics of a reference filter is proposed. The proposed method uses a genetic algorithm and a simulated annealing algorithm. The objective function used in this method is described with two kinds of weighting functions for identifying the phase and gain characteristics respectively. Therefore, the quantization accuracy on the gain characteristic is independent of the accuracy on the phase characteristic. Further, the proposed algorithm can be applied to any types of filters, because the chromosome expresses only their coefficients values. The efficiency of the proposed algorithm is verified by some experiments., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • A method for quantizing coefficients of a filter with genetic algorithm
    Y Aketa, M Haseyama, H Kitajima, N Nagai, ELECTRONICS AND COMMUNICATIONS IN JAPAN PART III-FUNDAMENTAL ELECTRONIC SCIENCE, 79, 4, 1, 10, 1996年04月
    This paper proposes a new method to quantize coefficients of filters where frequency-characteristic deterioration is suppressed. When a digital filter is realized, quantization errors cannot be avoided because operation circuits and registers have finite word lengths. Generally, filter coefficients are quantized by popular methods, such as rounding and omitting, etc. The pro; posed method obtains the quantized coefficients by search. The Genetic Algorithm is used for the search because it needs only objective function information. Further, by using the proposed method, the filter coefficients can be quantized with the frequency weight. Therefore, deterioration of the coefficients quantized by the proposed method is suppressed in the specified frequency region. The effectiveness of this method is shown by some simulations that quantize the four-line lattice and the direct form filter coefficients., SCRIPTA TECHNICA PUBL, 英語
  • カルマンフィルタのイノベーションを用いたマップマッチング法に関する考察
    城 崇, 長谷山 美紀, 北島 秀夫, 高堰 茂, 電子情報通信学会総合大会講演論文集, 1996, 163, 163, 1996年03月11日
    自動車用ナビゲーションシステムにおいて、車両の現在位置を正確に検出することは必要不可欠である。現在、自立航法、および衛星航法を用いて車両位置の検出が行われているが、これらの方法を用いることにより得られた車両位置には誤差が含まれているために、車両位置の表示が道路から外れるという問題が生じる。そこで、車両位置を道路上に修正するためにマップマッチング処理が必要とされる。マップマッチング法としては、走行軌跡と候補となる道路との相関を用いるパターンマッチング法などが提案されている。しかし、パターンマッチング法では相関が高くなるような範囲が広いために真の軌跡を特定することは困難である。そこで本文では、より高精度に走行軌跡を求めるためにカルマンフィルタのイノベーションを用いたマップマッチング法を提案する。, 一般社団法人電子情報通信学会, 日本語
  • モデルを用いたTV顔画像の口唇輪郭の自動抽出
    鐘 文, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 95, 504, 75, 80, 1996年02月02日
    口唇の自動理解には、口唇輪郭の自動抽出は必要である。本論文は、動的輪郭モデルSNAKEを用いて、TV顔画像の口唇輪郭の自動抽出手法を提案する。本手法は、唇に黒色の口紅を付ける等の特別な人工条件は不要であり、また、初期値の手動設定も必要としない。TV画像だけを入力として、口唇輪郭の自動抽出を行う。実験結果により、提案した手法は有効であることを示している。, 一般社団法人電子情報通信学会, 英語
  • モデルを用いたTV顔画像の口唇輪郭の自動抽出
    鐘 文, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 20, 5, 75, 80, 1996年02月02日
    口唇の自動理解には、口唇輪郭の自動抽出は必要である。本論文は、動的輪郭モデルSNAKEを用いて、TV顔画像の口唇輪郭の自動抽出手法を提案する。本手法は、唇に黒色の口紅を付ける等の特別な人工条件は不要であり、また、初期値の手動設定も必要としない。TV画像だけを人力として、口唇輪郭の自動抽出を行う。実験結果により、提案した手法は有効であることを示している。, 一般社団法人映像情報メディア学会, 日本語
  • 濃淡画像対応反復関数システムによる画像表現
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理, 79, 1, 18, 25, 1996年01月25日
    縮小写像による画像表現法のうち, ランダム反復関数システム (Random IFS) による方法には非常に多くの反復回数を必要とするという欠点がある. そこで本論文では, 局所方式の新たな画像表現の手法として, 濃淡画像対応反復関数システムによる画像表現法を提案する. 本手法は従来法に比べ少ない反復回数でIFSパラメータが決定可能であり, かつ従来手法よりも誤差の少ない再生画像が得られる. 本提案手法が従来手法より高速かつ良好なパラメータ決定および再生が可能であるのは以下の理由による. (1)ランダム反復関数システムでは, 写像が確率事象として定義され, 大数の法則が成立するように多数回の試行を必要とする. これに対し本手法では決定論的に写像を行うので, ランダム反復関数システムに比べて反復写像の収束が速くなる. また, 写像方法の違いにより精度が向上する. (2)本手法によって抽出される画像パラメータの画像中における統計的性質を明らかにする. この統計的性質は異なる画像間でも安定した形となることが実験的に明らかにされる. この性質を利用して, 画像のIFSパラメータ決定の高速化を図る. 最後に実験で, その高速化の検証を行っている., 一般社団法人電子情報通信学会, 日本語
  • 整数論的アダマール変換を用いた静止画像の可逆符号化
    星野亮, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 遺伝的アルゴリズムを用いたフラクタルブロック符号化の高速化に関する一考察
    小林亜令, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 定ブロックサイズIFSにおける画質向上に関する考察
    伊藤進策, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • MRFモデルによる領域内表現と遺伝的アルゴリズムを用いた画像の領域分割
    宮本俊洋, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • IFSを利用した画像復元法について
    一岡美佳子, 本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • IFSパラメータの量子化に関する一考察
    本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • GAとSAを用いたフィルタ形状の変換について
    浅水仁, 秋保政一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • カルマンフィルタを用いた高精度画像復元のための画像のモデリングに関する考察
    城崇, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 動画像のフレーム間予測誤差信号の量子化におけるいき値処理の効果
    金森紀文, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 遺伝的アルゴリズムを用いた経路探索
    稲垣潤, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 領域分割を用いた動画像のカット点検出法
    槙宏晃, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 動きに着目した物体抽出に関する一考察
    新井哲也, 長谷山美紀, 北島秀夫, 下野哲雄, 電気関係学会北海道支部連合大会講演論文集, 1996, 1996年
  • 領域分割による動画像のカット点検出法
    水野哲, 長谷山美紀, 北島秀夫, テレビジョン学会誌, 50, 1, 79, 86, 1996年
    This paper proposes a new cut-detection algorithm for image sequences. The new method is based on image segmentation and classification of the regions resulting from the segmentation. Each region is assigned to a class that terminates at a shot boundary. This technique is shown to be effective for gradual shot transitions, where conventional cut-detection algorithms are known to fail. It is also shown that the threshold with which the outputs of the cut detector are compared can be selected easily as the outputs are close to unity at cuts, while low elsewhere. The effectiveness of the proposed algorithm is demonstrated by experiments., Inst of Television Engineers of Japan, 日本語
  • ロスレス画像符号化のための数論変換
    北島秀夫, 長谷山 美紀, 下野 哲雄, 信学会1996年総合大会, 03, 29, 29, 1996年
    Orthogonal transforms such as the KLT, DCT, etc. are widely used in image data compression. The major virture of such transforms is energy compaction in the transform domain. Recently promising results have been reported in the use of orthogonal transforms in lossless coding, where special attention has been paid to possible arithmetic inaccuracies arising from finite register length. A more fundamental solution to the problem is the use of a finite integer ring. Orthogonal transforms over finite integer rings were investigated in efforts to efficiently compute convolution. In spite of their elegance and efficiency, they are in history due to their dynamic-range restrictions and the advent of VLSI-implemented floating-point arithmetic operations. In this paper we consider the use of transforms over rings of integers for possible image data compression, recalling them from the archive. The purpose of this paper is not to show any conclusive evidence but possibilities., 一般社団法人電子情報通信学会, 英語
  • 濃淡画像対応IFSのパラメータ量子化による再生画像への影響に関する一考察
    本多博之, 長谷山 美紀, 北島 秀夫, 松本 修一, 電子情報通信学会総合大会, 1996, 74, 74, 1996年
    IFS(反復関数システム)を用いたフラクタル画像符号化に関する研究が近年盛んに行なわれている。この際に問題となるのは決定されるパラメータの量子化誤差が実際に画像を再生する際に大きな影響を及ぼすことである。このため、量子化の際には最適なビット配分を用いることが重要となってくる。そこで、本文では、我々が以前提案した濃淡画像対応IFSを用い、このパラメータの量子化誤差を考慮する代わりに、パラメータに乱数によりノイズを付加し、その再生画像への影響を実験により調べた結果を報告する。, 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いたフィルタ係数の量子化法
    明田 吉浩, 長谷山 美紀, 北島 秀夫, 永井 信夫, 電子情報通信学会論文誌. A, 基礎・境界, 78, 12, 1542, 1549, 1995年12月25日
    本論文では周波数特性の劣化を抑えたフィルタ係数の量子化手法を提案する.ディジタルフィルタを実際に実現する場合,演算回路やレジスタの語長が有限なため,量子化誤差は避けることができない.従来,各係数は切捨てや丸めなどの一様な手法で量子化されている.提案手法は,量子化後表現可能な値を範囲として探索を行い,周波数特性の劣化を抑えた有限語長のフィルタを得る.探索アルゴリズムとして,広域探索に有効とされる遺伝的アルゴリズムを用いている.なぜならば,本手法では遺伝的アルゴリズムが評価関数の値以外に,評価関数の微分のような派生的な情報を必要としない性質をもつためである.更に,評価関数に周波数重みを考慮し周波数特性の劣化を抑えたい領域を指定することを可能とした.最後に提案手法を用いてARMA4線ラティスフィルタおよび直接形ARMAフィルタを量子化し,その有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズム及び焼きなまし法によるフィルタ係数の量子化法についての考察
    明田 吉浩, 長谷山 美紀, 北島 秀夫, 永井 信夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 95, 105, 97, 102, 1995年06月22日
    デジタルフィルタを実際に実現する場合、演算回路やレジスタの語長が有限なため、量子化誤差は避けることができない。すでに遺伝的アルゴリズムを用いて、量子化後安定かつ変化量が小さなフィルタを得るための量子化手法が提案されている。本報告ではすでに提案されている遺伝的アルゴリズムによる係数量子手法について探索能力の向上を目的とし遺伝的アルゴリズムに焼きなまし法を組み合わせて用いた手法を提案する。本文の最後にフィルタの量子化を行なう実験を行ない探索能力の向上を確認する。, 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いた画像の領域分割に関する一考察
    宮本 俊洋, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 95, 104, 45, 50, 1995年06月21日
    本文は画像の領域分割に対して遺伝的アルゴリズムを適用した手法を提案する。従来の領域分割法は全画面に同じ閾値処理を行うため、部分的に領域の細分化や過併合が発生する。それを解消するために本手法は遺伝的アルゴリズムを用い、各部分に適した領域分割を行う。本文ではまず画像の領域分割にGAを応用するためのパラメータを設定する。さらに提案アルゴリズムを用いた領域分割のシミュレーション結果を示し、有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタアルゴリズムにおけるイノベーションを用いた一画像復元法
    城 崇, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 95, 104, 59, 64, 1995年06月21日
    本文はカルマンフィルタを用いた画像復元を実現する際に必要とされる観測雑音の分散を、イノベーションが白色であるという性質を用いて推定する方法を提案する。また、実際に劣化した画像の雑音の分布が一様でない場合に画像全体の雑音の一様性を仮定しても有効な復元を行えない。したがって、画像を複数のブロックに分割し、ブロックごとの雑音の分散を推定することにより、雑音の分布が一様ではない場合の復元について考察する。, 一般社団法人電子情報通信学会, 日本語
  • マルチフレーム射影フィルターによる画像復元に関する提案
    菊池 学, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 95, 104, 65, 70, 1995年06月21日
    本論文では劣化画像から原画像を推定する画像復元問題において、相互に関連がある複数枚の画像を利用したマルチフレーム射影フィルター(MFPF: Multiframe Projection Filter)を提案する。射影フィルターは、ウィナーフィルターに比べて原画像の自己相関関数が未知でも画像復元が可能であるという利点をもつ。この利点を保ちつつ、さらに復元の精度を良好にするマルチフレーム射影フィルターの導出と画像復元のシミュレーションを行い、有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • 遺伝的アルゴリズムを用いた画像の領域分割に関する一考察
    宮本 俊洋, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 95, 107, 45, 50, 1995年06月21日
    本文は画像の領域分割に対して遺伝的アルゴリズムを適用した手法を提案する。従来の領域分割法は全画面に同じ閾値処理を行うため、部分的に領域の細分化や過併合が発生する。それを解消するために本手法は遺伝的アルゴリズムを用い、各部分に適した領域分割を行う。本文ではまず画像の領域分割にGAを応用するためのパラメータを設定する。さらに提案アルゴリズムを用いた領域分割のシミュレーション結果を示し、有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • カルマンフィルタアルゴリズムにおけるイノベーションを用いた-画像復元法
    城 崇, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 95, 107, 59, 64, 1995年06月21日
    本文はカルマンフィルタを用いた画像復元を実現する際に必要とされる観測雑音の分散を、イノベーションが白色であるという性質を用いて推定する方法を提案する。また、実際に劣化した画像の雑音の分布が一様でない場合に画像全体の雑音の一様性を仮定しても有効な復元を行えない。したがって、画像を複数のブロックに分割し、ブロックごとの雑音の分散を推定することにより、雑音の分布が一様ではない場合の復元について考察する。, 一般社団法人電子情報通信学会, 日本語
  • マルチフレーム射影フィルターによる画像復元に関する提案
    菊池 学, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. VLD, VLSI設計技術, 95, 107, 65, 70, 1995年06月21日
    本論文では劣化画像から原画像を推定する画像復元問題において、相互に関連がある複数枚の画像を利用したマルチフレーム射影フィルター(MFPF: Multiframe Projection Filter)を提案する。射影フィルターは、ウィナーフィルターに比べて原画像の自己相関関数が未知でも画像復元が可能であるという利点をもつ。この利点を保ちつつ、さらに復元の精度を良好にするマルチフレーム射影フィルターの導出と画像復元のシミュレーションを行い、有効性を確認する。, 一般社団法人電子情報通信学会, 日本語
  • 写像関数の変形による再生画像への影響
    本多 博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. IE, 画像工学, 95, 52, 1, 6, 1995年05月19日
    フラクタルによる画像表現において、写像の値域として矩形を用いるのが主流である。しかし、この写像方式ではブロック歪みによる誤差が目立ってしまう。本発表ではこの問題点を解決する為に、三角形の値域を持つ写像を検討する。値域が矩形の場合と三角形の場合、及び両者の合成画像について比較を行う。また、今まで用いていた輝度値に対するスケーリングを最小自乗誤差による方法へと変えることにより、画質向上が可能であることを示す。, 一般社団法人電子情報通信学会, 日本語
  • 特徴点に基づく画像表現
    北島 秀夫, 長谷川 美紀, 下野 哲雄, 電子情報通信学会総合大会講演論文集, 1995, 2, 23, 23, 1995年03月27日
    This paper proposes feature-point-based image representation.Smooth windows centered on arbitrarily specified feature points are used to extract image contents associated with them.The image contents can be combined with background information to reconstruct the image., 一般社団法人電子情報通信学会, 英語
  • 可変ブロックサイズ動き補償におけるブロックサイズ決定閾値選択に関する考察
    吉田 仁, 長谷山 美紀, 北島 秀夫, 電子情報通信学会総合大会講演論文集, 1995, 2, 42, 42, 1995年03月27日
    文献で提案されている動き補償アルゴリズム(以下VBSMPMCアルゴリズムと呼ぶ)を用いる場合、動き補償に与えるビット数と予測誤差の符号化に与えるビット数の設定によって圧縮効率が変化する。従って、実際にユーザーがこのアルゴリズムを用いる場合、ビット部分を適切に決定することが必要となる。そこで本文では、このアルゴリズムの閾値選択の実験結果を述べる。, 一般社団法人電子情報通信学会, 日本語
  • 可変ブロックサイズ動き補償アルゴリズムにおけるパラメータ設定法についての考察
    吉田 仁, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 19, 6, 31, 36, 1995年02月02日
    This paper reviews earlier work concerning variable-block-size motion compensation and proposes a plan for optimum bit allocation between motion-related information and motion-compensated interframe prediction residues. Detection of the parameter which detect optimum bit allocation is confirmed by video coding simulation., 一般社団法人映像情報メディア学会, 日本語
  • 2)連続画像の表現におけるKL基底の問題点(画像通信システム研究会)
    塚原 正人, 長谷山 美紀, 北島 秀夫, テレビジョン学会誌, 49, 1, 112, 112, 1995年01月20日
    一般社団法人映像情報メディア学会, 日本語
  • 8)テレビジョン画像のシーン境界の検出法に関する一考案(画像通信システム研究会)
    水野 哲, 長谷山 美紀, 北島 秀夫, テレビジョン学会誌, 49, 1, 113, 113, 1995年01月20日
    一般社団法人映像情報メディア学会, 日本語
  • 10)領域分割符号化に関する検討 : 領域作成法と領域内信号の符号化について(画像通信システム研究会)
    泉 洋平, 長谷山 美紀, 北島 秀夫, テレビジョン学会誌, 49, 1, 113, 113, 1995年01月20日
    一般社団法人映像情報メディア学会, 日本語
  • 14)可変ブロックサイズ動き補償画像符号化におけるビット配分に関する考察(画像通信システム研究会)
    吉田 仁, 長谷山 美紀, 北島 秀夫, テレビジョン学会誌, 49, 1, 113, 114, 1995年01月20日
    一般社団法人映像情報メディア学会, 日本語
  • 4)画像生成における縮小写像の実験的検討(画像通信システム研究会)
    本多 博之, 長谷山 美紀, 北島 秀夫, テレビジョン学会誌, 49, 1, 114, 114, 1995年01月20日
    一般社団法人映像情報メディア学会, 日本語
  • 2次式近似による領域内表現に基づく遺伝的アルゴリズムを用いた画像の領域分割
    宮本俊洋, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • マルチフレーム射影フィルターによる画像復元の高精度化に関する一考察
    菊池学, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • 遺伝的アルゴリズムによる位相特性を考慮したフィルタ係数の量子化法
    明田吉浩, 長谷山美紀, 北島秀夫, 永井信夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • カルマンフィルタを用いた高精度画像復元に関する一考察
    城崇, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • 動画像符号化における動き補償の評価に関する考察
    吉田仁, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • ファジィクラスタリングを用いた時変信号の解析
    江村真史, 長谷山美紀, 北島秀夫, 永井信夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • 画像のフラクタルブロック符号化におけるスケーリングパラメータの統計的性質
    伊藤進策, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • 一般化コラージュ定理に基づくIFSについて
    本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1995, 1995年
  • 遺伝的アルゴリズムによるARMA4線ラティスフィルタ係数の量子化法について
    明田吉浩, 長谷山美紀, 北島秀夫, 永井信夫, 電子情報通信学会技術研究報告, 94, 522(SP94 91-97), 1995年
  • ARMAXモデル同定のためのラティスフィルタ
    長谷山美紀, 北島秀夫, 電子情報通信学会大会講演論文集, 1995, Sogo Pt 1, 1995年
  • A METHOD FOR REALIZATION OF AN ARMAX LATTICE FILTER
    M HASEYAMA, Y AKETA, H KITAJIMA, 1995 INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING - CONFERENCE PROCEEDINGS, VOLS 1-5, 3, 1705, 1708, 1995年
    This paper proposes a method for realization of an ARMAX lattice filter. ARMAX (Autoregressive Moving Average model with Exogenous Variable) model identification is significant because the ARMAX model is a standard tool in the control field, and it can be performed by the proposed algorithm. One of the recursive least-square methods for the ARMAX model identification is the ELS (Extended Least Squares). Applied to the ARMAX model identification, the ELS uses o(N2) multiplications, where N = AR order + MA order + X order. When the proposed realization method of the ARMAX lattice filter is used, o(M) multiplications are needed for the ARMAX model identification, where M = max{AR order, MA order, X order}., I E E E, 英語
  • Realization method of an ARMAX lattice filter
    Miki Haseyama, Tohru Hirohku, Hideo Kitajima, Proceedings - IEEE International Symposium on Circuits and Systems, 1, 365, 368, 1995年01月01日
    In this paper, a method for realization of an ARMAX lattice filter is proposed. Since the ARMAX model is a standard tool in control, it is significant to solve ARMAX model identification problems and the proposed algorithm can solve it. One of the recursive least-square methods for the ARMAX model identification is the ELS (Extended Least Squares). If the ELS is applied to the ARMAX model identification, it uses o(N2) multiplications, where N Δ/= AR order + MA order + X order. By using the proposed realization method, o(N) multiplications are needed for the ARMAX model identification., IEEE
  • 複素数論変換適用によるSAR画像再生の高速化の検討
    松山 好幸, 長谷山 美紀, 北島 秀夫, 白川 智昭, 小川 吉彦, 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers, 77, 10, 2054, 2062, 1994年10月25日
    本論文では,SAR(合成開口レーダ)の画像再生における計算量を軽減するために,数論変換の適用を提案する.SAR画像再生処理において重要な部分を占める相関計算に対して,量子化器が最適化されている場合,画像再生に必要な量子化ビット数は3ビットまで下げられることを示す.また,overlap-add法を導入しレーダ信号の長い系列を分割することにより,複素数論変換のダイナミックレンジに関する問題を克服することが可能であることを示す.メルセンヌ素数q=2^<13>-1とq=2^<17>-1を法とする変換が,それぞれ3ビット,4ビットに量子化して長さをN=4096に分割したレーダ信号の系列に対して適合していることを示す., 一般社団法人電子情報通信学会, 日本語
  • 画像生成における縮小写像の実験的検討 : 画像通信システム
    本多 博之, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 18, 49, 21, 26, 1994年09月22日
    フラクタルによる濃淡画像符号化の方式には大きく分けて二つの方式がある。一つが大域方式であり、もう一つは、局所方式である。現在、局所方式の主流はランダム反復関数システム(Random IFS)による方法であるが、この方式は非常に多くの反復回数を必要とする欠点がある。そこで本文では、この欠点を解決するために、コラージュ定理に基づいた新たな符号化方式として、濃淡画像対応反復関数システムによる符号化法を提案する。本手法によって復元される画像とパラメータとの統計的性質を明らかにすることにより、本手法の有効性を示す。, 一般社団法人映像情報メディア学会, 日本語
  • 連続画像の表現におけるKL基底の問題点
    塚原 正人, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. OFS, オフィスシステム, 94, 245, 9, 14, 1994年09月21日
    連続画像を離散値として表現する手法の一つとして,Karhunen-Loeve展開(以後,KL展開)がある.本研究では,1次元信号を用いてKL展開を施し,展開係数の打ち切りによる影響を調べる.そして,打ち切りにより誤差が信号両端の付近において特に大きくなる傾向を持つことを実験的かつ統計的に説明する., 一般社団法人電子情報通信学会, 日本語
  • テレビジョン画像のシーン境界の検出法に関する一考察
    水野 哲, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. OFS, オフィスシステム, 94, 245, 49, 54, 1994年09月21日
    本論文では、画像の内容を抽出するために、閉領域に分割し、その領域を追跡することで、ビデオテープなどの画像データに含まれるカット点の検出率の向上をねらう。二つのフレーム間の変化量に着目している従来のカット点検出方法とは、異なったアルゴリズムを提案する。, 一般社団法人電子情報通信学会, 日本語
  • 領域分割符号化に関する検討 : 領域作成法と領域内信号の符号化について
    泉 洋平, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術研究報告. OFS, オフィスシステム, 94, 245, 61, 66, 1994年09月21日
    画像中の物体の持つ構造的な特徴に着目する方式の一つである領域分割符号化において、人間の視覚に適当な領域、及び輪郭抽出、そしてそれらを可能な限り自然に近似し能率良く符号化することが重要である。本研究では、すでに提案されている隣接画素間の輝度値の差を用いた領域分割の方法について検討する。さらにその欠点を解決するために、領域の大きさが視覚に与える影響を考慮し、領域の大きさに依存した領域分割の手法の導入を提案する。また、領域内輝度信号の符号化法について簡単な表現を用いて検討を行う。, 一般社団法人電子情報通信学会, 日本語
  • 連続画像の表現におけるKL基底の問題点 : 画像通信システム
    塚原 正人, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 18, 48, 9, 14, 1994年09月21日
    連続画像を離散値として表現する手法の一つとして,Karhunen-Loeve(以後,KL展開)がある.本研究では,1次元信号を用いてKL展開を施し,展開係数の打ち切りによる影響を調べる.そして,打ち切りにより誤差が信号両端の付近において特に大きくなる傾向を持つことを実験的かつ統計的に説明する., 一般社団法人映像情報メディア学会, 日本語
  • テレビジョン画像のシーン境界の検出法に関する一考察 : 画像通信システム
    水野 哲, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 18, 48, 49, 54, 1994年09月21日
    本論文では、画像の内容を描出するために、閉領域に分割し、その領域を追跡することで、ビデオテープなどの画像データに含まれるカット点の検出率の向上をねらう。二つのフレーム間の変化量に着目している従来のカット点検出方法とは、異なったアルゴリズムを提案する。, 一般社団法人映像情報メディア学会, 日本語
  • 領域分割符号化に関する検討 : 領域作成法と領域内信号の符号化について : 画像通信システム
    泉 洋平, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 18, 48, 61, 66, 1994年09月21日
    画像中の物体の持つ構造的な特徴に着目する方式の一つである領域分割符合化において、人間の視覚に適当な領域、及び輪郭抽出、そしてそれらを可能な限り自然に近似し能率良く符号化することが重要である。本研究では、すでに提案されている隣接画素間の輝度値の差を用いた領域分割の方法について検討する。さらにその欠点を解決するために、領域の大きさが視覚に与える影響を考慮し、領域の大きさに依存した領域分割の手法の導入を提案する。また、領域内輝度信号の符号化法について簡単な表現を用いて検討を行う。, 一般社団法人映像情報メディア学会, 日本語
  • 可変ブロックサイズ動き補償画像符号化におけるビット配分に関する考察 : 画像通信システム
    吉田 仁, 長谷山 美紀, 北島 秀夫, テレビジョン学会技術報告, 18, 48, 91, 96, 1994年09月21日
    本論文は可変ブロックサイズを用いて高精度な動き補償を行うために必要なパラメータの設定法を示す。一般に用いられている固定ブロックサイズでの動き補償の問題点一動き補償では動きの激しい部分と、穏やかな部分で同じサイズのブロックを用いて動き補償を行うため動きが精度良く求まらなかったり、ブロック歪みが生じたりするーの改善を目的とし、動き情報とフレーム間予測誤差へのビット配分を考察する。, 一般社団法人映像情報メディア学会, 日本語
  • 動画像符号化のための動きパラメータを用いた可変ブロックサイズ動き補償
    木村 祥勝, 長谷山 美紀, 北島 秀夫, 白川 智昭, 小川 吉彦, 電子情報通信学会論文誌. D-II, 情報・システム, II-情報処理 = The transactions of the Institute of Electronics, Information and Communication Engineers, 77, 7, 1273, 1281, 1994年07月25日
    動画像の符号化において,従来動き補償の方式として用いられているブロックマッチング法は,対象ブロックの動きが平行移動であるという前提で動き探索を行うものである.そのため,平行移動以外の動きには対応できないという問題があった.この問題を解決するために,本論文では,動きを1次式モデルで表現し,動き補償を行う方法を提案する.画素ごとに検出した動きベクトルをもとに,動きモデルにおけるパラメータをブロックごとに決定し,これを伝送する.受信側では,この動きパラメータから画素ごとに動きを決定するため,平行移動以外の動きにも対応することができる.更に,ブロックサイズを可変にすることによりブロック数の低減を図る.動きパラメータの符号化においては,ベクトル量子化を施す.これらによるブロック当りのパラメータ数の増加に伴う動き情報に要するビット数増加の抑制をねらう.シミュレーションでは,実際に動画像に対してフレーム間動き補償を行い,動き補償予測誤差を示す.更に,予測誤差信号の符号化も行い,復元画像のSNRとビットレートを示して,総合的に符号化特性を評価することにより本方式の有効性を確認する., 一般社団法人電子情報通信学会, 日本語
  • ARMAラティスフィルタの感度特性に関する研究
    明田 吉浩, 長谷山 美紀, 北島 秀夫, 永井 信夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 94, 117, 25, 30, 1994年06月24日
    信号分析後、その形状を保ったまま信号合成フィルタとして用いることができるARMAラティスフィルタが提案されている。信号合成フィルタを考える場合、係数感度が1つの問題となる。しかしARMAラティスフィルタの係数感度の理論的な解析は容易ではない。そのため本文では、実験により直接表現型ARMAフィルタと比較してARMAラティスフィルタの感度特性についてを考察する。実験では、係数の語長を制限した場合に、伝達関数の極及び零点がどのように変化するかを実験により調べ、さらに、一般に用いられる感度尺度により感度比較を行なった。またラティスフィルタの個々の係数について感度解析実験を行ない、係数間に感度特性の差があることを確認し、さらにその感度差に一定の規則があることを見い出した。, 一般社団法人電子情報通信学会, 日本語
  • ファジィ推論を用いた時変ARMAモデルの次数推定法について
    江村 真史, 長谷山 美紀, 北島 秀夫, 永井 信夫, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 94, 117, 31, 36, 1994年06月24日
    ARMAモデルを用いて同定を行なう際には、ARMA次数をあらかじめ決定しておく必要がある。これまでAICのような多くの次数推定法が提案されているが、それらの多くは参照モデルについての知識を有効に利用しているとは言い難い。なぜならば、多くの情報は漠然と表現されているためその暖味な情報を表現するのことは容易ではないためである。そのような知識が次数推定に利用できれば、より高精度なモデル同定を達成することが期待できる。そのような、主観的で漠然とした情報を表現することができる手法の一つにファジィ推論がある。ファジィ推論は、あいまいな情報をファジィ命題の形で表現することが可能である。そこで、本文ではまず、すでに提案されているファジィ推論を用いたARMA次数推定法について検証する。さらに、ファジィクラスタリングを用いて参照信号の時刻変化部を検出する手法を提案する。また、クラスタリングの結果を用いて再帰型フィジィ推論における忘却係数を決定しARMA次数を推定する手法を提案する。, 一般社団法人電子情報通信学会, 日本語
  • AN ARMA ORDER SELECTION METHOD WITH FUZZY THEOREM
    M HASEYAMA, H KITAJIMA, M EMURA, N NAGAI, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E77A, 6, 937, 943, 1994年06月
    In this paper, an ARMA order selection method is proposed with a fuzzy reasoning method. In order to identify the reference model with the ARMA model, we need to determine its ARMA order. A less or more ARMA order, other than a suitable order causes problems such as; lack of spectral information, increasing calculation cost, etc. Therefore, ARMA order selection is significant for a high accurate ARMA model identification. The proposed method attempts to select an ARMA order of a time-varying model with the following procedures: (1) Suppose the parameters of the reference model change slowly, by introducing recursive fuzzy reasoning method, the estimated order is selected. (2) By introducing a fuzzy c-mean clustering method, the period of the time during which the reference model is changing is detected and the forgetting factor of the recursive fuzzy reasoning method is set. Further, membership functions used in our algorithm are original, which are realized by experiments. In this paper, experiments are documented in order to validate the performance of the proposed method., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • RELATION BETWEEN RLS AND ARMA LATTICE FILTER REALIZATION-ALGORITHM AND ITS APPLICATION
    M HASEYAMA, N NAGAI, H KITAJIMA, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E77A, 5, 839, 846, 1994年05月
    In this paper, the relationship between the recursive least square (RLS) method with a U-D decomposition algorithm and ARMA lattice filter realization algorithm is presented. Both the RLS method and the lattice filter realization algorithm are used for the same applications, such as model identification, etc, therefore, it is expected that the lattice filter algorithm is in some ways related to the RLS. Though some of the proposed lattice filter algorithms have been derived by the RLS method, they do not express the relationship between RLS and ARMA lattice filter realization algorithm. In order to describe the relation clearly, a new structure of ARMA lattice fitter is proposed. Further, based on the relationship, a method of model identification with frequency weighting (MIFW), which is different from a previous method, is derived. The new MIFW method modifies the lattice parameters which are acquired without a frequency weighting and obtain the parameters of an ARMA model, which is identified with frequency weighting. The proposed MIFW method has the following restrictions: (1) The used frequency weighting is FIR filter with a low order. (2) By using the parameters of the ARMA lattice filter with ARMA (N,M) order and the frequency weighting with L order, the new ARMA parameter with the frequency weighting is with ARMA(N-L,M-L) order. By using the proposed MIFW method, the ARMA parameters estimated with the frequency weighting can be obtained without starting the computation again., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • RELATION BETWEEN RLS AND ARMA LATTICE FILTER REALIZATION-ALGORITHM AND ITS APPLICATION
    M HASEYAMA, N NAGAI, H KITAJIMA, IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES, E77A, 5, 839, 846, 1994年05月
    In this paper, the relationship between the recursive least square (RLS) method with a U-D decomposition algorithm and ARMA lattice filter realization algorithm is presented. Both the RLS method and the lattice filter realization algorithm are used for the same applications, such as model identification, etc, therefore, it is expected that the lattice filter algorithm is in some ways related to the RLS. Though some of the proposed lattice filter algorithms have been derived by the RLS method, they do not express the relationship between RLS and ARMA lattice filter realization algorithm. In order to describe the relation clearly, a new structure of ARMA lattice fitter is proposed. Further, based on the relationship, a method of model identification with frequency weighting (MIFW), which is different from a previous method, is derived. The new MIFW method modifies the lattice parameters which are acquired without a frequency weighting and obtain the parameters of an ARMA model, which is identified with frequency weighting. The proposed MIFW method has the following restrictions: (1) The used frequency weighting is FIR filter with a low order. (2) By using the parameters of the ARMA lattice filter with ARMA (N,M) order and the frequency weighting with L order, the new ARMA parameter with the frequency weighting is with ARMA(N-L,M-L) order. By using the proposed MIFW method, the ARMA parameters estimated with the frequency weighting can be obtained without starting the computation again., IEICE-INST ELECTRONICS INFORMATION COMMUNICATIONS ENG, 英語
  • 9)流れ画像復元におけるカルマンフィルタのパラメータ設定についての考察([情報ディスプレイ研究会 視聴覚技術研究会 画像処理・コンピュータビジョン研究会 画像通信システム研究会 画像応用研究会]合同)
    近藤 慶一, 長谷山 美紀, 北島 秀夫, 白川 智昭, 小川 吉彦, テレビジョン学会誌, 48, 4, 531, 531, 1994年04月20日
    一般社団法人映像情報メディア学会, 日本語
  • 画像データ圧縮用直交変換の決定論的性質の検討
    北島 秀夫, 長谷山 美紀, 電子情報通信学会技術研究報告. IE, 画像工学, 93, 451, 39, 44, 1994年01月28日
    本論文は画像データ圧縮用の直交変換の新しい評価法を提案する。画像の変換符号化の際の、変換係数の切捨てによる低域フィルタ効果を評価すべくインパルス応答解析を導入する。また、量子化雑音をフーリェ周波数領域で評価して人間の視覚特性と対応させるべく、変換基底のフーリェ解析を導入する。例として、これら二つの決定論的評価法を、統計的意味で検討されてきたDCT、SCTに適用した結果を示す。, 一般社団法人電子情報通信学会, 英語
  • 画像データ圧縮用直交変換の決定論的性質の検討 : 情報ディスプレイ/視聴覚技術/画像応用/画像処理・コンピュータビジョン/画像通信システム
    北鳥 秀夫, 長谷山 美紀, テレビジョン学会技術報告, 18, 7, 39, 44, 1994年01月28日
    本論文は画像データ圧縮用の直交変換の新しい評価法を提案する。画像の変換符号化の際の、変換係数の切捨てによる低域フィルタ効果を評価すべくインパルス応答解析を導入する。また、量子化雑音をフーリェ周波数領域で評価して人間の視覚特性と対応させるべく、変換基底のフーリェ解析を導入する。例として、これら二つの決定論的評価法を、統計的意味で検討されてきたDCT,SCTに適用した結果を示す。, 一般社団法人映像情報メディア学会, 英語
  • 流れ画像復元におけるカルマンフィルタのパラメータ設定についての考察
    近藤 慶一, 長谷山 美紀, 北島 秀夫, 白川 智昭, 小川 吉彦, 電子情報通信学会技術研究報告. IE, 画像工学, 93, 450, 61, 66, 1994年01月27日
    本論文は流れ画像復元におけるカルマンフィルタの設計に必要な未知パラメータの推定方法、及びその際に生じる誤差による影響を考察する。カルマンフィルタのイノベーションの性質に着目することにより、パラメータの推定精度向上が可能であることを示す。, 一般社団法人電子情報通信学会, 日本語
  • 流れ画像復元におけるカルマンフィルタのパラメータ設定についての考察 : 情報ディスプレイ/視聴覚技術/画像応用/画像処理・コンピュータビジョン/画像通信システム
    近藤 慶一, 長谷山 美紀, 北島 秀夫, 白川 智昭, 小川 吉彦, テレビジョン学会技術報告, 18, 6, 61, 66, 1994年01月27日
    本論文は流れ画像復元におけるカルマンフィルタの設計に必要な未知パラメータの推定方法、及びその際に生じる誤差による影響を考察する。カルマンフィルタのイノベーションの性質に着目することにより、パラメータの推定精度向上が可能であることを示す。, 一般社団法人映像情報メディア学会, 日本語
  • 可変ブロックサイズ動き補償画像符号化法利用のための一考察
    吉田仁, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • 遺伝的アルゴリズムを用いたラティスフィルタ係数の量子化法
    明田吉浩, 長谷山美紀, 北島秀夫, 永井信夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • カルマンフィルタのイノベーションによるマルチフレーム画像復元
    近藤慶一, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • ファジィクラスタリングを用いた次数推定法について
    江村真史, 長谷山美紀, 北島秀夫, 永井信夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • 動画像データ中のカット点の検出法に関する一考察
    水野哲, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • ノイズを含んだ画像における勾配法を用いた3次元領域拡張
    菊池学, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • 濃淡画像対応反復関数システムによる画像符号化
    本多博之, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • 画像符号化のための自然な領域分割法
    泉洋平, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • 連続信号のKL展開における打ち切り誤差の時間分布
    塚原正人, 長谷山美紀, 北島秀夫, 電気関係学会北海道支部連合大会講演論文集, 1994, 1994年
  • ARMAラティスフィルタを用いた周波数重み同定の一手法
    長谷山美紀, 北島秀夫, 永井信夫, 電子情報通信学会大会講演論文集, 1994, Shunki Pt 1, 1994年
  • A realization method for an ARMA lattice filter with reduced number of coefficients
    Miki Haseyama, Nobuo Nagai, Nobuhiro Miki, Electronics and Communications in Japan (Part III: Fundamental Electronic Science), 77, 8, 14, 27, 1994年
    This paper proposes realization methods of two kinds of low sensitivity ARMA lattice filters which can perform frequency‐weighting model identification with input estimation and low sensitivity of their filters. Using the proposed realization method, the filter with the fewer coefficients than the previous filter can be obtained. Since the calculation costs for the realization of the filter are reduced, the proposed realization methods are significant. Furthermore, assuming that the ARMA lattice filters have low sensitivity, however, this paper shows that the proposed ARMA lattice filters have low sensitivity by simulations, which is important for practical implementation of filters. Copyright © 1994 Wiley Periodicals, Inc., A Wiley Company, 英語
  • 流れ画像復元のためのカルマンフィルタにおけるパラメータ設定に関する考察
    近藤 慶一, 長谷山 美紀, 北島 秀夫, 白川 智昭, 小川 吉彦, テレビジョン学会誌, 48, 8, 1058, 1063, 1994年
    本論文では, 流れ画像の復元におけるカルマンフィルタの設計パラメータの中で, 流れの長さが復元精度を向上するために重要であることを示す.さらに, イノベーションの性質に着目し, 流れの長さの精度向上を可能とする一手法を示す., 一般社団法人映像情報メディア学会, 日本語
  • 可変ブロックサイズ動き補償画像符号化におけるビット配分に関する考察
    吉田仁, 長谷山 美紀, 電子情報通信学会技術研究報告, 91, 96, 1994年
    本論文は可変ブロックサイズを用いて高精度な動き補償を行うために必要なパラメータの設定法を示す。一般に用いられている固定ブロックサイズでの動き補償の問題点-動き補償では動きの激しい部分と、穏やかな部分で同じサイズのブロックを用いて動き補償を行うため動きが精度良く求まらなかったり、ブロック歪みが生じたりする-の改善を目的とし、動き情報とフレーム間予測誤差へのビット配分を考察する。, 一般社団法人電子情報通信学会, 日本語
  • 画像生成における縮小写像の実験的検討
    本多博之, 長谷山 美紀, 北島 秀夫, 電子情報通信学会技術報告, 94, 246, 21, 26, 1994年
    フラクタルによる濃淡画像符号化の方式には大きく分けて二つの方式がある。一つが大域方式であり、もう一つは、局所方式である。現在、局所方式の主流はランダム反復関数システム(Random IFS)による方法であるが、この方式は非常に多くの反復回数を必要とする欠点がある。そこで本文では、この欠点を解決するために、コラージュ定理に基づいて新たな符号化方式として、濃淡画像対応反復関数システムによる符号化法を提案する。本手法によって復元される画像とパラメータとの統計的性質を明らかにすることにより、本手法の有効性を示す。, 一般社団法人電子情報通信学会, 日本語
  • 乗算器個数を削減したARMA格子形フィルタの実現法
    長谷山 美紀, 永井 信夫, 三木 信弘, 電子情報通信学会論文誌. A, 基礎・境界, 76, 12, 1714, 1724, 1993年12月01日
    入力信号が未知のモデルについて,周波数重みを付けたモデル同定を可能とするARMA4線格子形フィルタが既に提案され,その応用が重要であることが述べられているが,乗算器個数が多いことが欠点とされていた.そこで本論文では,このような同定法が可能な乗算器個数の少ないARMA格子形フィルタの実現法を提案する.乗算器個数の削減は,直接計算量の削減につながり,特に適応処理を行う場合には重要である.本論文では,2種類のフィルタの実現法を提案している.提案されている2種類のARMA格子形フィルタは,実現に用いられる予測誤差の違いにより異なった性質をもつ.本論文では,提案する二つのフィルタおよび乗算器個数の多い従来のフィルタについて,各々を用いる場合にどのような点が異なるかを示す.最後に,本論文で提案するフィルタおよび従来のフィルタは,得られたラティス構造を保ったまま,信号合成フィルタとして用いることができることから,そのような応用を行った場合の係数感度についての考察を実験により行う.実験より,乗算器個数の削減による感度特性の劣化が生じていないことを確認する., 一般社団法人電子情報通信学会, 日本語
  • 逐次最小2乗法とARMAラティスフィルタ実現アルゴリズム
    長谷山 美紀, 永井 信夫, 三木 信弘, 電子情報通信学会技術研究報告. CAS, 回路とシステム, 93, 33, 35, 40, 1993年05月20日
    逐次最小2乗法(Recursive least square method:RLS法)は、線形モデルを最小2乗推定する逐次処理アルゴリズムである。RLS法のアルゴリズムは、簡単で推定結果も安定しているために非常によく用いられている。一方、ARMAラティスフィルタの逐次処理型実現手法が提案されている。両者は、同様の応用が可能である異なったアルゴリズムである。そこで、本文ではラティスフィルタ実現アルゴリズムとRLS法を比較し、その違いを考察する。その際、特にU-D分解アルゴリズムを用いたRLS法を考え、ラティスフィルタ実現アルゴリズムでは、どのように対応しているのかを考える。最後に本文では、導出した関係を用いて、既に実現したフィルタ係数を用いて低次数のFIRフィルタで重みを付けたARMA係数を算出する手法を提案する。, 一般社団法人電子情報通信学会, 日本語
  • ARMAラティスフィルタ実現アルゴリズムにおける正規方程式の解法
    長谷山美紀, 永井信夫, 三木信弘, 電気関係学会北海道支部連合大会講演論文集, 1993, 1993年
  • ARMAラティスフィルタ実現における正規方程式の解法について
    長谷山美紀, 永井信夫, 三木信弘, 電子情報通信学会大会講演論文集, 1993, Shuki Pt 1, 1993年
  • An Adaptive ARMA Four-Line Lattice Filter for Spectral Estimation with Frequency Weighting
    Miki Haseyama, Nobuo Nagai, Nobuhiro Miki, IEEE Transactions on Signal Processing, 41, 6, 2193, 2207, 1993年
    This paper proposes a method for designing an adaptive four-line lattice filter which can perform “frequency-weighting spectral estimation.” Frequency-weighting spectral estimation is a method by which we can obtain more accurate spectral estimation for some frequency bands than for others. By using a suitable “frequency-weighting function,” denoted as an ARMA model, we can obtain an estimated spectrum by arbitrarily weighting some frequency bands more heavily than others. If the frequency-weighting function has the property of a lowpass filter, we can estimate the spectrum of the reference model accurately with a reduced ARMA order in the low frequency band. Therefore, the frequency-weighting method is useful for accurately estimating models with a reduced ARMA order in the specified frequency band. Further, using the proposed algorithm, we can estimate spectra of time-varying models with an exponentially weighted sliding window, and we can also estimate the input signal of the reference model by assumption. In this paper, we introduce the order-update and the time-update recursive formulas and also the frequency-weighting method for the proposed filter. In order to verify the proposed algorithm, we present a number of experiments of spectral estimation for a time-varying and unknown-input model. © 1993 IEEE, 英語
  • ARMA4線ラティスフィルタの係数感度についての一考察
    長谷山美紀, 永井信夫, 鈴木正清, 三木信弘, 電子情報通信学会大会講演論文集, 1992, Shunki Pt 1, 1992年
  • ファジィ推論を用いたARMA次数の推定についての一考察
    津島峰生, 長谷山美紀, 三木信弘, 永井信夫, 電子情報通信学会大会講演論文集, 1992, Shunki Pt 1, 1992年
  • A method of realizing an adaptive normalized ARMA lattice filter
    Miki Haseyama, Nobuo Nagai, Nobuhiro Miki, Electronics and Communications in Japan (Part III: Fundamental Electronic Science), 75, 4, 71, 78, 1992年
    This paper proposes a method of realizing an adaptive normalized ARMA lattice filter. This filter was proposed in a previous paper and can be realized with an arbitrary ARMA order and with all the lattice coefficients less than one. Furthermore, these coefficients are equal, so the structure is simplified. The adaptive realization method proposed in this paper retains these features. In addition, we perform spectral estimation of a time‐varying signal with frequency weighting and model identification of an unknown input system. In our paper we describe an experiment with a real speech signal to prove that our algorithm can be used for frequency‐weighted spectral estimation. The use of real data to perform spectral estimation has not been attempted in other references. Copyright © 1992 Wiley Periodicals, Inc., A Wiley Company, 英語
  • 適応型規格化ARMA格子形フィルタの実現法
    長谷山 美紀, 永井 信夫, 三木 信弘, 電子情報通信学会論文誌 A 基礎・境界, 74, 10, p1483, 1489, 1991年10月
    電子情報通信学会基礎・境界ソサイエティ, 日本語
  • ARMAラティスフィルタの実現に関する一考察
    長谷山美紀, 永井信夫, 三木信弘, 電子情報通信学会技術研究報告, 91, 54(CAS91 1-13), 1991年
  • Designing method for ARMA four‐line lattice filter with sliding rectangular window
    Miki Haseyama, Nobuo Nagai, Nobuhiro Miki, Electronics and Communications in Japan (Part III: Fundamental Electronic Science), 74, 9, 11, 21, 1991年
    This paper derives a design method for an ARMA 4‐line lattice filter using a sliding rectangular window. The adaptive ARMA 4‐line lattice filter already proposed uses a forgetting factor, which is one of the weighting functions to estimate coefficients of a time‐varying system in which system coefficients vary with sufficient smoothness. Therefore, the effect of past observed signal over the estimated coefficients decreases exponentially. The filter presented here is realized using a rectangular window because the concern is over the effects of past observation signal rather than window length. Using this filter, an input signal is estimated when designing; furthermore, a system can be identified in which an arbitrary section in the frequency domain is weighted. Thus, by not only analyzing voice signal which is considered a model whose input signal is unknown and EEG data but also by weighting the frequency domain, for example, the holmant in the low‐frequency domain can be estimated in low degree with very high precision and a specific wave (such as a α activities) in EEG data can also be detected. Moreover, in this paper the algorithm is verified by model experiments. Copyright © 1991 Wiley Periodicals, Inc., A Wiley Company, 英語
  • スライディング方形窓を用いたARMA4線格子形フィルタの設計法について
    長谷山 美紀, 永井 信夫, 三木 信弘, 電子情報通信学会論文誌 A 基礎・境界, 74, 1, p9, 18, 1991年01月
    電子情報通信学会基礎・境界ソサイエティ, 日本語
  • 適応型ARMA4線ラティスフィルタ基本区間の接続に関する一考察
    長谷山美紀, 永井信夫, 三木信弘, 電子情報通信学会全国大会講演論文集, 1990, Spring Pt.1, 1990年
  • 適応型ARMA4線ラティスフィルタについての考察 スライディング方形窓を用いたスペクトル推定
    長谷山美紀, 永井信夫, 三木信弘, 電子情報通信学会技術研究報告, 90, 179(SP90 39-43), 1990年
  • Model identification weighted in the frequency domain with ARMA 4-lines lattice filter
    Miki Haseyama, Nobuo Nagai, Nobuhiro Miki, Electronics and Communications in Japan, Part III: Fundamental Electronic Science (English translation of Denshi Tsushin Gakkai Ronbunshi), 73, 1, 8, 1990年01月01日
    This paper presents a frequency-weighted model identification method which employs an ARMA four-lines lattice filter developed by the authors. This lattice filter is used to estimate the ARMA identification weighting in the optional frequency region. Using this method, the frequency-weighted characteristics of a model with an unknown input can be extracted by employing the ARMA four-lines lattice filter. The ARMA coefficients are approximated as a reduced-order model for frequency-weighted model identification using an unknown input system. Finally, time-update and order-update recursions are derived and used to estimate the input of an unknown input system.
  • Normalized ARMA lattice filter and its terminal conditions
    Miki Haseyama, Nobuo Nagai, Nobuhiro Miki, Yoshikazu Miyanaga, Electronics and Communications in Japan (Part III: Fundamental Electronic Science), 72, 2, 1, 13, 1989年
    In this paper it is shown that covariant data of a synthesized signal corresponds to the covariant data of a real signal. This occurs when an ARMA lattice synthesis filter is used and the minimum mean square value of the estimation error is zero. Hence, a new terminal condition of the ARMA lattice filter is derived so that the covariant data of the synthesized signal will always correspond to the covariant data of a real signal. To this end, a design method for the normalized ARMA lattice filter is presented in this paper, and normalized estimation errors are derived. Finally, the starting condition and design for the normalized ARMA lattice filter is given. Copyright © 1989 Wiley Periodicals, Inc., A Wiley Company, 英語
  • ARMA4線格子形フィルタを用いた周波数重み付けモデル同定手法について
    長谷山 美紀, 永井 信夫, 三木 信弘, 電子情報通信学会論文誌 A 基礎・境界, 72, 1, p80, 86, 1989年01月
    電子情報通信学会基礎・境界ソサイエティ, 日本語
  • 規格化ARMAラチスフィルタの任意次数増減法について
    長谷山 美紀, 永井 信夫, 三木 信弘, 電子情報通信学会論文誌 A 基礎・境界, 71, 6, p1242, 1248, 1988年06月
    電子情報通信学会基礎・境界ソサイエティ, 日本語
  • 規格化ARMAラチスフィルタとその始終端条件
    長谷山 美紀, 電子情報通信学会論文誌 A 基礎・境界, 70, 8, p1115, 1125, 1987年08月
    電子情報通信学会基礎・境界ソサイエティ, 日本語
  • 最適次数ARMAラティスフィルタ構成に関する一考察
    長谷山美紀, 永井信夫, 三木信弘, 宮永喜一, 電子情報通信学会技術研究報告, 87, 148, 1987年

書籍等出版物

  • 原理がわかる信号処理
    長谷山, 美紀
    共立出版, 2021年08月, 9784320086517, v, 115p, 日本語
  • バイオメティクス・エコミメティクスー持続可能な循環型社会へ導く技術革新のヒントー               
    pp.92-97
    2021年01月, [共著]
  • 人と共生する AI革命 活用事例から見る生活・産業・社会の未来展望               
    pp.21-29
    2019年06月, [共著]
  • 持続可能社会を拓くバイオミメティクス--生物学と工学が築く材料科学               
    pp.38-45
    2018年03月, [共著]
  • トコトンやさしいバイオミメティクスの本               
    pp.136-137
    2016年03月, [共著]
  • 生物の形や能力を利用する学問 バイオミメティクス               
    pp.124-132
    2016年03月, [共著]
  • 生物模倣技術と新材料・新製品開発への応用               
    長谷山 美紀, 第5節
    2014年07月, [共著]
  • 著作画像の非破壊配信を目的とした新しい著作認証システムの実現
    長谷山 美紀
    [北海道大学大学院情報科学研究科], 2005年, 1冊

講演・口頭発表等

  • サッカー映像におけるグループ戦術解析のための優勢度推定に関する一考察
    高橋翔, 長谷山美紀
    映像情報メディア学会技術報告, 2015年12月03日, 日本語
  • アクティブネットを用いたサッカー映像におけるパス可能領域推定の並列計算による高速化に関する検討
    高橋翔, 長谷山美紀
    映像情報メディア学会技術報告, 2015年12月03日, 日本語
  • 顔器官の動きに基づく関心の有無の推定に関する検討
    佐坂勇磨, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • サッカー映像における試合内容の理解を促すデータの提示に関する検討
    高橋翔, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • 楽曲中の歌唱区間推定における簡易脳波計の導入に関する検討
    菅田健斗, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • 胃X線画像を用いたHelicobacter pylori感染の高精度識別に関する検討(2)―撮像方向が識別に有効な画像領域に与える影響に対する考察―
    藤後廉, 石原賢太, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • 個々の道路構造物に関する点検項目の導入による道路構造物の変状推定の高精度化に関する検討
    前田圭介, 高橋翔, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • Web映像検索のためWebコミュニティの提示法に関する検討―Webコミュニティに含まれるトピックを考慮した代表キーフレーズ抽出の試み―
    竹原大智, 原川良介, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • 道路構造物の変状画像に対する類似検索の高精度化に関する検討
    高橋翔, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • 画像共有サービスにおける投稿画像の分類結果の信頼度推定に関する検討
    斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2015年11月07日, 日本語
  • 映像と視聴動作の関連性に基づくユーザの嗜好の推定に関する検討―視聴動作データが少数の場合の精度劣化低減手法の実現―
    山口由晃, 小川貴弘, 浅水仁, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 胃X線画像におけるHelicobacter pylori感染識別に関する検討~特徴統合と識別結果統合の識別精度比較~
    石原賢太, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 顕微鏡による生物の撮像方法に着目した超解像に関する検討
    廣川真梨子, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 走査型電子顕微鏡画像を用いた生物の分類の高精度化―顕微鏡画像の取得方法に注目した学習データ選択法の導入―
    PIAO Jun, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • Web映像検索のためのWebコミュニティの階層構造提示法に関する一検討―Webコミュニティを代表するキーワード抽出の試み―
    原川良介, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 画像共有サイトの投稿画像の高精度な分類に関する検討
    斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • Superpixel算出手法の導入による光源および分光反射率推定の高精度化に関する検討
    五十嵐祐太, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 社会インフラの維持管理業務効率化のための点検データ分析に関する検討―撮影画像と点検結果に基づく点検データ間の関連性の定量化―
    三改木裕矢, 高橋翔, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 楽曲聴取時の個人の脳波信号を利用した好みの楽曲の識別に関する検討―クラス情報を考慮した正準相関分析による高精度化―
    澤田充奨, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • 画像注視時の脳波特徴量を用いた画像分類に関する検討(4)―複数のユーザの脳波を用いた分類精度の検証―
    川上拓也, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2015年02月16日, 日本語
  • ネットワーク解析を用いたサッカー映像における重要選手と類似場面の検出に関する一考察
    高橋翔, 長谷山美紀
    映像情報メディア学会技術報告, 2014年12月05日, 日本語
  • トピックモデルに基づく音響特徴と時間情報を考慮した流行曲識別に関する検討
    木下奨平, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • 維持管理業務の効率化に向けた点検データの類似度算出における特徴選択に関する検討
    三改木裕矢, 高橋翔, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • パワースペクトログラム誤差最小化に基づく消失音響区間の再構成手法に関する検討
    田中佑磨, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • 複数の画像特徴を用いたベイジアンネットワークに基づく構造物の変状の推定の高精度化に関する検討
    前田圭介, 高橋翔, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • Web映像検索のための意味内容を考慮したWebコミュニティの階層構造抽出に関する一検討
    竹原大智, 原川良介, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • 画像共有サイトへの投稿画像およびそのメタデータに注目したマルチモーダル画像検索手法に関する検討
    斉藤直輝, 小川貴弘, 浅水仁, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • トピックモデルを用いた複数特徴の統合による画像群の可視化に関する検討
    館農浩平, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • 視聴動作に基づくユーザの関心対象を考慮した映像に対する関心の有無の識別に関する検討
    山口由晃, 小川貴弘, 浅水仁, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2014年10月25日, 日本語
  • バイオミメティクス・データ検索基盤と新材料開発
    長谷山美紀
    高分子学会予稿集(CD-ROM), 2014年09月03日, 日本語
  • バイオミメティクス・データ検索による生物形態の類縁性の可視化とその産業応用
    長谷山美紀
    日本動物学会大会予稿集, 2014年08月07日, 日本語
  • メディア理解のための発想支援型検索の試み
    長谷山美紀
    電子情報通信学会技術研究報告, 2014年03月06日, 日本語
  • 個人の嗜好を表現可能なトピックモデルの提案とその楽曲推薦への応用に関する検討
    中西亮太, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 色品質改善のための拡張ジョイントバイラテラルフィルタ
    和田直史, 数井誠人, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 可視および近赤外領域に感度を有するディジタルカメラを用いた分光反射率推定に関する検討―光源スペクトル推定の導入―
    五十嵐祐太, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 画像注視時の脳波特徴量を用いた画像分類に関する検討(2)―単一試行の脳波から算出された特徴量の有効性の検証―
    川上拓也, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 生物の顕微鏡像を用いた科の推定に関する検討 分類体系を表す決定木の改良による高精度化
    PIAO Jun, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • Web映像コミュニティの階層構造抽出の大規模データ適用に関する一検討
    原川良介, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • Hidden Conditional Random Fieldsによる映像の構造解析に基づくシーン分割の高精度化に関する検討
    吉田壮, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • タグ付き画像を用いた同一意味を表現するタグの選択に関する検討
    SONG Yan, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 動画像の事例ベース超解像のランク最小化に基づく高精度化に関する検討
    廣川真梨子, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 昆虫の走査型電子顕微鏡像による科の分類に関する検討―画像特徴を用いた階層型クラスタリングによる高精度化―
    高橋昌弘, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • ネットワーク分析を用いたサッカー選手の特徴定義とその選手間類似度算出への応用
    岩井和也, 高橋翔, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • 橋梁の点検画像を用いたベイジアンネットワークによる変状の推定に関する検討
    小林克希, 高橋翔, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • カルマンフィルタを用いたエラーコンシールメントの高精度化に関する検討~物体の運動を考慮した状態遷移モデルの実現~
    大貫修平, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2014年02月10日, 日本語
  • MISSING INTENSITY RESTORATION VIA PERCEPTUALLY OPTIMIZED SUBSPACE PROJECTION BASED ON ENTROPY COMPONENT ANALYSIS
    OGAWA Takahiro, HASEYAMA Miki
    Proc IEEE Int Conf Acoust Speech Signal Process, 2014年, 英語
  • Exhibition Method of Hierarchical Structure of Web Communities Using Community Density for Web Video Retrieval
    HARAKAWA Ryosuke, OGAWA Takahiro, HASEYAMA Miki
    Dig Tech Pap IEEE Int Conf Consum Electron, 2014年, 英語
  • NOVEL IMAGE CLASSIFICATION BASED ON DECISION-LEVEL FUSION OF EEG AND VISUAL FEATURES
    KAWAKAMI Takuya, OGAWA Takahiro, HASEYAMA Miki
    Proc IEEE Int Conf Acoust Speech Signal Process, 2014年, 英語
  • 胃X線二重造影像を用いたHelicobacter pylori感染の識別の高精度化に関する検討
    石原賢太, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013年10月, 日本語
  • 脳波特徴に基づく人間の楽曲聴取時における感情推定に関する検討
    澤田充奨, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013年10月, 日本語
  • 判別分析に基づいた順序回帰の導入による協調フィルタリングでのSparsity Problemの軽減に関する一検討
    川島孝行, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2013年10月, 日本語
  • ビッグデータからの価値創出―「気づき」を生み出す画像検索―
    長谷山美紀
    電子情報通信学会技術研究報告, 2013年09月06日, 日本語
  • 3D DWTビデオ伝送のビット誤り耐性の強化(知的マルチメディアシステム,一般)
    大村 光徳, 山嵜 彰一郎, 松嶋 智子, 田中 宏和, 長谷山 美紀
    電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム, 2013年09月05日, 日本語
    3次元離散ウェーブレット変換(3D DWT)を用いて符号化されたビデオ伝送における誤り耐性強化の方式として,共著者らにより3D DWT出力の最低周波数成分(LL)の二重化方式が提案されている.本稿ではLL係数二重化のビット数を減らし,LL隣接係数を二重化する方式,および誤りのある係数を値"ゼロ"に置換することにより修復する,誤り耐性強化方式を提案する.伝送路にバースト誤りモデルを適用したシミュレーションにより比較評価を行い,PSNRおよびビデオの再生画質において,提案方式による誤り耐性強化の有効性が確認された.
  • インバーティブル誤り訂正符号を利用した3D DWTビデオ伝送の誤り耐性強化(一般セッション,フレッシュマンセッション,一般)
    大村 光徳, 山嵜 彰一郎, 松嶋 智子, 田中 宏和, 長谷山 美紀
    電子情報通信学会技術研究報告. IT, 情報理論, 2013年07月18日, 日本語
    本稿では,3次元離散ウェーブレット変換(three-dimensional discrete wavelet transform: 3D DWT)を用いたビデオ伝送において,インバーティブル誤り訂正符号を利用した誤り耐性強化方式を提案する.近年,ビデオ伝送にウェーブレット変換を適用する多くの研究がなされてきているが,そのなかで,ウェーブレット変換出力の最低周波数成分がビデオの再生画質に大きな影響を与えることが知られている.本提案では,この最低周波数成分の伝送に符号化率1/2のインバーティブル誤り訂正符号を適用し,誤り耐性を強化する.シミュレーションでは,共著者が提案している最低周波数成分の二重化による従来方式と比較し,誤り耐性の向上を評価する.
  • 工学的気づきを生み出すバイオミメティクスデータ検索基盤
    長谷山美紀
    高分子夏季大学講演予稿集, 2013年07月03日, 日本語
  • ボール保持チームに注目したサッカー映像分割の高精度化に関する検討
    大貫修平, 高橋翔, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 視聴動作から推定される関心度を用いた映像の推薦の高精度化に関する検討
    白石哲夫, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 映像検索結果の定量評価手法の応用に関する試み(1)―札幌市における実証実験を通した映像検索システムの評価―
    山之内豊, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 道路映像中のシカ検出のための画像特徴量に関する検討
    桂井麻里衣, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 音響特徴量に基づくクラシック音楽の分類に関する一考察
    松野恵一, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 犯罪捜査における足跡鑑定のための靴裏画像検索に関する検討
    畠山泰貴, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • ベイジアンネットワークを用いた除雪作業データの分析に関する検討
    高橋信太郎, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 弾性モデルを用いたサッカーの選手追跡に関する検討~新たなポテンシャルエネルギーの導入による高精度化~
    岩井和也, 高橋翔, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • ポピュラー音楽データベースにおけるトレンド検出に関する検討
    中西亮太, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 歌謡番組における映像の構造に注目したシーン分割手法―顔認識のシーン分割精度に与える効果の検証―
    吉田壮, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 特徴統合理論に基づく画像検索結果の提示法の評価~異なる提示法の比較による有効性の検証~
    小林克希, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 胃X線二重造影像を用いたHelicobacter pylori感染の識別に関する検討
    吉崎茜, 桂井麻里衣, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 野球映像における投手のコンディション推定の高精度化に関する検討 投球動作および投球結果を表す特徴量の改良
    久保純貴, 高橋翔, 小川貴弘, 長谷山美紀
    電子情報通信学会技術研究報告, 2013年02月11日, 日本語
  • 選手の移動速度を考慮したサッカー映像における3次元パス可能領域の推定に関する検討
    高橋翔, 長谷山美紀
    映像情報メディア学会冬季大会講演予稿集(CD-ROM), 2012年11月27日, 日本語
  • サッカーのチーム戦術推定手法を用いた試合映像の分割に関する検討
    大貫修平, 高橋翔, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 歌詞と音響特徴を用いたファジィ分類による音楽ジャンル帰属度の定義に関する検討
    中西亮太, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 画像検索結果の提示方法の有効性評価に関する検討―特徴統合理論に基づく評価指標の実現―
    小林克希, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 視聴動作から推定される関心度を用いた映像の推薦に関する検討
    白石哲夫, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 順序回帰を用いた数値予報の誤差解析における高精度化に関する検討
    高橋信太郎, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • クラシック楽曲信号から算出される特徴量の改良と時代分類の高精度化に関する考察
    松野恵一, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 連想型映像検索における検索過程の分析に関する一考察
    山之内豊, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 映像のシーン分割における複数特徴量の協調利用の有効性に関する評価
    宋妍, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 物体認識における識別器の高精度化に関する検討 SVMを用いた物体領域の自動選定手法の導入
    吉田壮, 小川貴弘, 長谷山美紀
    電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM), 2012年10月20日, 日本語
  • 犯罪捜査のための靴裏画像の類似度算出に関する検討 (ITS)
    畠山 泰貴, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 人間の動きに基づく楽曲推薦手法の実データ適用に関する検討 (ITS)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 移動方向を考慮した道路映像中のシカ検出の高精度化に関する検討 (ITS)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 可視光成分と近赤外光成分が重畳された画像の色補正 : 自然画像の色成分を用いた色変換の検討 (ITS)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 数値予報における予報誤差の解析の高精度化に関する検討 (ITS)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • Dimensionality Reduction of Sparse Visual Features via Recoverable Projection for Large-Scale Image Retrieval (ITS)
    何 再興, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 英語
  • 犯罪捜査のための靴裏画像の類似度算出に関する検討 (画像工学)
    畠山 泰貴, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 人間の動きに基づく楽曲推薦手法の実データ適用に関する検討 (画像工学)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • アマチュアサッカーチームの試合映像における重要場面の検出 : コーチングを目的として映像に付与されたコメントの利用 (画像工学)
    高橋 翔, 嶌田 聡, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • A note on the application of Web information to near-duplicate online video detection (画像工学)
    ペンコフ マイケル, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 英語
  • 視聴動作から推定される関心度を用いたユーザクラスタリングに関する検討 (画像工学)
    白石 哲夫, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 移動方向を考慮した道路映像中のシカ検出の高精度化に関する検討 (画像工学)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • 可視光成分と近赤外光成分が重畳された画像の色補正 : 自然画像の色成分を用いた色変換の検討 (画像工学)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • Dimensionality Reduction of Sparse Visual Features via Recoverable Projection for Large-Scale Image Retrieval (画像工学)
    何 再興, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 英語
  • 数値予報における予報誤差の解析の高精度化に関する検討 (画像工学)
    高橋 信太郎, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • アマチュアサッカーチームの試合映像における重要場面の検出 : コーチングを目的として映像に付与されたコメントの利用 (ITS)
    高橋 翔, 嶌田 聡, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • A note on the application of Web information to near-duplicate online video detection (ITS)
    ペンコフ マイケル, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 英語
  • 視聴動作から推定される関心度を用いたユーザクラスタリングに関する検討 (ITS)
    白石 哲夫, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告 : 信学技報, 2012年02月20日, 日本語
  • Dynamic Coalescence Modelの高速化に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    海田 健, 長谷山 美紀, 北島 秀夫, 富田 眞吾
    電子情報通信学会技術研究報告. ITS, 2012年02月13日, 日本語
    クラスタ分析手法(クラスタリング手法)であるDynamic Coalescence Model(DCM)の計算量が削減された,DCMの改良手法を提案する.多くの混合分布において,その構成分布の数は未知であり,形は複雑である.その上,構成分布の位置関係は複雑である.DCMを用いることにより,その様な構成分布を点の集まり(クラスタ)に分割することが可能になる.しかし,DCMが計算量は多いため,実用的でない.提案する改良DCMの計算時間は,オリジナルDCMの計算時間より短い.
  • Dynamic Coalescence Model の高速化に関する一考察
    海田 健, 長谷山 美紀, 北島 秀夫, 富田 眞吾
    電子情報通信学会技術研究報告. ITS, 2012年02月13日, 日本語
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2012年02月13日, 日本語
  • Dynamic Coalescence Model の高速化に関する一考察
    海田 健, 長谷山 美紀, 北島 秀夫, 富田 眞吾
    電子情報通信学会技術研究報告. IE, 画像工学, 2012年02月13日, 日本語
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2012年02月13日, 日本語
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2012年02月13日, 日本語
    本文では,電子レセプトから医療資源を最も投入した傷病を推定する手法を提案する.提案手法では,確率的トピックモデルの一手法であるLabeled LDAにより,傷病に対する診療内容を診療行為,医薬品および特定保険医療材料の確率分布として表し,電子レセプトに記載された複数の傷病に対する診療内容をそれらの混合分布として表すモデルを構築する.この結果を用いることで傷病毎の診療報酬点数の推計を行うことが可能となり,高精度な傷病の推定が実現する.
  • Dynamic Coalescence Modelの高速化に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    海田 健, 長谷山 美紀, 北島 秀夫, 富田 眞吾
    電子情報通信学会技術研究報告. IE, 画像工学, 2012年02月13日, 日本語
    クラスタ分析手法(クラスタリング手法)であるDynamic Coalescence Model(DCM)の計算量が削減された,DCMの改良手法を提案する.多くの混合分布において,その構成分布の数は未知であり,形は複雑である.その上,構成分布の位置関係は複雑である.DCMを用いることにより,その様な構成分布を点の集まり(クラスタ)に分割することが可能になる.しかし,DCMが計算量は多いため,実用的でない.提案する改良DCMの計算時間は,オリジナルDCMの計算時間より短い.
  • 電子レセプトからの医療資源を最も投入した傷病の推定の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2012年02月13日, 日本語
    本文では,電子レセプトから医療資源を最も投入した傷病を推定する手法を提案する.提案手法では,確率的トピックモデルの一手法であるLabeled LDAにより,傷病に対する診療内容を診療行為,医薬品および特定保険医療材料の確率分布として表し,電子レセプトに記載された複数の傷病に対する診療内容をそれらの混合分布として表すモデルを構築する.この結果を用いることで傷病毎の診療報酬点数の推計を行うことが可能となり,高精度な傷病の推定が実現する.
  • 選手動作と歓声の関係性に注目したサッカー映像における重要場面の検出に関する検討(第8部門メディア処理2)
    久保 純貴, 高橋 翔, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会年次大会講演予稿集, 2011年08月, 日本語
    This paper presents a detection method of important events based on relationship between player action and sound on stadium in soccer videos. Generally, since player action and sound on stadium have high correlation in the important events, we realize the detection by using their relationship based on canonical correlation analysis.
  • ぶれにより劣化した画像の復元に関する一考察 :事前確率分布の適応的なパラメータ設定の導入(第10部門画像処理2)
    吉崎 茜, 和泉 大佑, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会年次大会講演予稿集, 2011年08月, 日本語
    This paper presents a method for blurred image restoration. The proposed method adopts object matching for PSF estimation and adaptive parameter setting of a prior probability distribution for latent image estimation. Then, accurate blur removal becomes feasible without suffering from ringing artifacts.
  • 購買履歴データ解析によるユーザの嗜好の可視化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    高谷 太紹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,購買履歴データを解析することで,複数のユーザにより構成されるユーザ集合の嗜好を分析し,それを可視化する手法を提案する.提案手法は,同時に購買された商品の組み合わせから特徴ベクトルを定義し,あらかじめユーザをプロフィールにより分類することで求めたユーザ集合を,互いに比較することでユーザ集合間の嗜好の差異を表現する.提案手法は,Bag-oLWbrdsに着想を得たデータ解析を行っており,あるユーザの購買履歴データが十分に得られていない場合でも,そのユーザを含むユーザ集合の購買履歴データを利用し,ユーザ集合の嗜好を推定することが可能となる.さらに,算出されたユーザ集合の嗜好を表す特徴ベクトルに対し,多次元尺度構成法を施すことにより,その嗜好の可視化も可能とする.
  • 簡便な画像処理による交通流計測とその実データへの適用への試み(ITS画像処理,映像メディア,視覚及び一般)
    西野 泰典, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,道路監視カメラにより撮像された映像から走行車両の検出を行い,その検出結果より車速計測,車種判別を行う手法を提案する.提案手法では,日照条件によって,車体またはヘッドライトの光に基づいた,車速計測,車種判別を実現する.また,薄暮時など,短時間で日照が変化する環境下での交通流計測の高精度化を行うために,検出に利用される特徴である車体またはヘッドライトの光を対象の映像より自動で選択する処理を導入する.これにより,薄暮時の映像において,輝度ヒストグラムを用いて昼夜の交通流計測手法を切り替えた場合よりも,頑健な交通流計測が期待される.
  • 複数種類の識別器を用いた電子レセプトデータからの傷病名推定に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,電子レセプトデータに記載されている診療情報から医療資源を最も投入した傷病名を推定する手法について提案する.提案手法では,医療資源を最も投入した傷病名が明記されているDiagnosis Procedure Combination(DPC)データを教師データとし,診療情報から算出される特徴ベクトルと医療資源を最も投入した傷病名を表すラベルの組を用いて識別器を構築する.これにより,電子レセプトデータから医療資源を最も投入した傷病名の推定が可能となる.また本文では,複数種類の識別器より得られる推定結果を併用することにより,傷病名推定の高精度化について検討する.
  • ぶれにより劣化した低解像度動画像の高解像度化に関する考察 : PSFを用いた事後確率の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,ぶれにより劣化した低解像度動画像に対して,ぶれ関数を推定し,ぶれの除去及び高解像度化を同時に行う手法を提案する.提案手法では,高解像度フレームとぶれ関数の事後確率を定義することで,最大事後確率推定を用いて,それらを同時に推定する.このとき,ぶれ関数については,輝度勾配に注目し,フレーム中から自動で選択したエッジを多く含む領域を用いて,その推定を行う.このように,ぶれ関数の推定に適した領域を用いることで,その精度の向上が期待できる.以上により,提案手法では,ぶれ関数の推定誤差により生じる再構成結果の劣化を抑制し,高精度にぶれの除去及び高解像度化を実現する.
  • 撮像物体の対応を考慮したMCMC法に基づくシーン分割の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,撮像物体の対応を考慮したMarkov Chain Monte Carlo(MCMC)法に基づくシーン分割手法を提案する.提案手法では,映像中に含まれる対象物体の回転,スケール変化及び照明の変化に頑健なSIFT特徴量を用いて,特徴点による物体の対応付けを行い,得られるショット間の類似度に基づいて映像の構造に基づくシーン境界候補の抽出を行う.このとき,SIFTを用いることで,従来の手法で多く用いられる色ヒストグラム特徴量を用いた場合に撮像環境における対象物体の変化が大きいために発生していたシーンの過分割を抑制することが可能となる.さらに,提案手法ではMCMC法に基づいてシーン境界候補から真のシーン境界を推定する.このとき,映像の構造に注目して,シーン分割を行うことにより,従来のMCMC法を用いた手法に比べ,映像の構造を明確に持つ映像コンテンツのシーン分割が可能となる.本文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.さらに,提案手法及び従来手法で用いられる各特徴量がシーン分割に与える影響について考察を行う.
  • 顕微鏡画像中に含まれる底生生物の自動分類法 : SVDDを用いた分類の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    長谷川 尭史, 小川 貴弘, 渡邉 日出海, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,Support Vector Data Description(SVDD)を用いた顕微鏡画像中に含まれる生物の自動分類法を提案する.提案手法では,数種類の底生生物の画像を対象としてSVDDを用いた学習を行い,生成された識別器を用いて実際に撮像した顕微鏡画像中に含まれる生物の生物種分類を行う.このとき,SVDDの識別のみでは一度に多くの生物種を高精度に分類することは困難であるため,階層的な分岐処理を導入する.具体的に高精度に識別可能な生物種を順次取り除き生物種を絞り込むことで,複数の生物種を扱った場合でもより高精度な分類を行うことを可能とする.
  • 複数の気象データを用いたフロー推定法の高精度化に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    李 徳智, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,複数の気象データを用いたフロー推定の高精度化に関する検討を行う.提案手法では,雲量のデータから三次元空間におけるフローを推定するため,二次元データを処理するための従来手法を三次元へ拡張する.さらに,風速や上昇流のデータからフロー推定の際の制約条件を新たに設定する.これにより,雲量のみを利用したフロー推定法と比較して,より高精度なフローの算出を可能とする.
  • 対象物検出機能を含むSVDDに基づく識別器の高精度化に関する一検討(ITS画像処理,映像メディア,視覚及び一般)
    岡田 周史, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,対象物検出機能を含むSVDDに基づく識別器の高精度化手法を提案する.提案手法では,対象物を含む学習画像からSVDDにより算出される超球の中心からの距離に基づいて,対象物を含む領域を自動で選択し,新たな学習画像を生成する.これにより,対象物の位置や向き,大きさ,形状などが多様な学習画像を用いた場合であっても,対象物を含む領域のみを新たに正例として識別器の学習に利用することが可能となる.また,選択された領域を内包する様々なサイズの局所ブロックも同時に新たな正例として利用することで,対象物を含む正例のバリエーションを増やすことが可能となる.以上により,近年の学習に基づく手法や局所特徴に基づく手法において困難であった,対象物を含む領域の自動選択,および得られる領域に基づく新たな学習画像の生成が可能となり,識別精度の向上が実現される.本文の最後では,提案手法の有効性を確認するため,実画像を用いた比較実験により性能の評価を行う.
  • 映像から取得した人間の動きと楽曲との関係に基づく楽曲推薦手法 : 自動化と高精度化のための検討(ITS画像処理,映像メディア,視覚及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,以前に我々が提案した映像から取得される人間の動きと楽曲の関係に基づく楽曲推薦手法の高精度化と自動化について検討を行う.提案手法では,カーネル正準相関分析に基づく人間の動きと楽曲との関係のモデル化を行う際人間が含まれる領域を予め与える必要がある.そこで,本文では,映像から得られる動き特徴に基づき,人間が撮像されている領域の自動抽出を可能とし,自動で楽曲を推薦することを可能とする.本文の最後では,映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • サッカー映像におけるパス可能領域の推定手法の高精度化に関する考察 : 適応的なパラメータ設定法の導入(ITS画像処理,映像メディア,視覚及び一般)
    高橋 翔, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本稿では,サッカー映像においてパスが可能な領域を推定する際に用いている2つのパラメータ,選手の走行速度およびボールの速度の適応的な設定法を導入することで,より高精度なパス可能領域の推定を実現する.我々はこれまで,ボールの速度や選手の走行速度としてその平均値を用い,選手位置に基づいてパス可能領域の推定を行った.しかしながら,実際のサッカー競技においてパスが行われる場面では,試合の状況や選手の身体能力によってボールおよび選手の速度が大きく異なり,それらは攻撃および守備の選手同士の距離や密度によって変化している.よって,より高精度なパス可能領域の推定を実現するためには,ボールの速度および選手の走行速度を攻撃および守備の選手同士の距離や密度に基づいて適応的に設定する必要がある。そこで,提案手法では,サッカー映像から取得する選手位置を用いて,選手の走行速度およびボールの速度に関するパラメータの適応的な設定を行う.これにより,パス可能領域の推定手法の高精度化が実現される.
  • 映像特徴量を用いたWebコミュニティ抽出手法の高速化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    畠山 泰貴, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,Locality Sensitive Hashingを用いた映像特徴量に基づく高速なWebコミュニティ抽出手法を提案する.提案手法は映像から得られる画像,音響及び映像を含むWebページから得られるテキスト特徴に対し,Locality Sensitive Hashingを施すことで高速に映像間の類似度計算を可能とする.さらに,得られた映像問の類似度と映像を含むWebページのリンク関係に基づいて類似した内容の映像集合であるWebコミュニティの抽出を行う.したがって,提案手法は高速にWebコミュニティの抽出が可能となり,大規模なデータセットに対しても高速な映像検索が実現される.
  • 画像特徴を用いたキーワードの階層化手法とその画像アノテーションへの応用(ITS画像処理,映像メディア,視覚及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    本文では,画像特徴を用いたキーワードの階層化手法を提案し,その画像アノテーションへの応用について検討する.提案手法では,意味的に上位となるキーワードほど,そのキーワードの付与された画像セットにおける画像特徴のばらつきが大きくなることに着目し,以下のアプローチによりキーワードの階層化を行う.まず,あるキーワードに関する画像セットにおいて,画像特徴に基づくクラスタリングを適用する。次に,得られた結果に対し,キーワードの視覚的多様性を表す指標を導入する.具体的に,この指標は,各クラスタにおける画像特徴の分散及びクラスタ間の類似度から算出し,値を降順に並べることで,画像特徴に基づくキーワードの階層化が可能となる.得られた階層性に基づき,まず意味的に下位となるキーワードを画像特徴を用いて推定し,それらのキーワードと強い関係を持つ上位のキーワードを付与することで,画像アノテーションの高精度化が期待される.
  • 購買履歴データ解析によるユーザの嗜好の可視化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    高谷 太紹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,購買履歴データを解析することで,複数のユーザにより構成されるユーザ集合の嗜好を分析し,それを可視化する手法を提案する.提案手法は,同時に購買された商品の組み合わせから特徴ベクトルを定義し,あらかじめユーザをプロフィールにより分類することで求めたユーザ集合を,互いに比較することでユーザ集合間の嗜好の差異を表現する.提案手法は,Bag-oLWbrdsに着想を得たデータ解析を行っており,あるユーザの購買履歴データが十分に得られていない場合でも,そのユーザを含むユーザ集合の購買履歴データを利用し,ユーザ集合の嗜好を推定することが可能となる.さらに,算出されたユーザ集合の嗜好を表す特徴ベクトルに対し,多次元尺度構成法を施すことにより,その嗜好の可視化も可能とする.
  • 簡便な画像処理による交通流計測とその実データへの適用への試み(ITS画像処理,映像メディア,視覚及び一般)
    西野 泰典, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,道路監視カメラにより撮像された映像から走行車両の検出を行い,その検出結果より車速計測,車種判別を行う手法を提案する.提案手法では,日照条件によって,車体またはヘッドライトの光に基づいた,車速計測,車種判別を実現する.また,薄暮時など,短時間で日照が変化する環境下での交通流計測の高精度化を行うために,検出に利用される特徴である車体またはヘッドライトの光を対象の映像より自動で選択する処理を導入する.これにより,薄暮時の映像において,輝度ヒストグラムを用いて昼夜の交通流計測手法を切り替えた場合よりも,頑健な交通流計測が期待される.
  • 複数種類の識別器を用いた電子レセプトデータからの傷病名推定に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,電子レセプトデータに記載されている診療情報から医療資源を最も投入した傷病名を推定する手法について提案する.提案手法では,医療資源を最も投入した傷病名が明記されているDiagnosis Procedure Combination(DPC)データを教師データとし,診療情報から算出される特徴ベクトルと医療資源を最も投入した傷病名を表すラベルの組を用いて識別器を構築する.これにより,電子レセプトデータから医療資源を最も投入した傷病名の推定が可能となる.また本文では,複数種類の識別器より得られる推定結果を併用することにより,傷病名推定の高精度化について検討する.
  • ぶれにより劣化した低解像度動画像の高解像度化に関する考察 : PSFを用いた事後確率の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,ぶれにより劣化した低解像度動画像に対して,ぶれ関数を推定し,ぶれの除去及び高解像度化を同時に行う手法を提案する.提案手法では,高解像度フレームとぶれ関数の事後確率を定義することで,最大事後確率推定を用いて,それらを同時に推定する.このとき,ぶれ関数については,輝度勾配に注目し,フレーム中から自動で選択したエッジを多く含む領域を用いて,その推定を行う.このように,ぶれ関数の推定に適した領域を用いることで,その精度の向上が期待できる.以上により,提案手法では,ぶれ関数の推定誤差により生じる再構成結果の劣化を抑制し,高精度にぶれの除去及び高解像度化を実現する.
  • 撮像物体の対応を考慮したMCMC法に基づくシーン分割の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,撮像物体の対応を考慮したMarkov Chain Monte Carlo(MCMC)法に基づくシーン分割手法を提案する.提案手法では,映像中に含まれる対象物体の回転,スケール変化及び照明の変化に頑健なSIFT特徴量を用いて,特徴点による物体の対応付けを行い,得られるショット間の類似度に基づいて映像の構造に基づくシーン境界候補の抽出を行う.このとき,SIFTを用いることで,従来の手法で多く用いられる色ヒストグラム特徴量を用いた場合に撮像環境における対象物体の変化が大きいために発生していたシーンの過分割を抑制することが可能となる.さらに,提案手法ではMCMC法に基づいてシーン境界候補から真のシーン境界を推定する.このとき,映像の構造に注目して,シーン分割を行うことにより,従来のMCMC法を用いた手法に比べ,映像の構造を明確に持つ映像コンテンツのシーン分割が可能となる.本文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.さらに,提案手法及び従来手法で用いられる各特徴量がシーン分割に与える影響について考察を行う.
  • 対象物検出機能を含むSVDDに基づく識別器の高精度化に関する一検討(ITS画像処理,映像メディア,視覚及び一般)
    岡田 周史, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,対象物検出機能を含むSVDDに基づく識別器の高精度化手法を提案する.提案手法では,対象物を含む学習画像からSVDDにより算出される超球の中心からの距離に基づいて,対象物を含む領域を自動で選択し,新たな学習画像を生成する.これにより,対象物の位置や向き,大きさ,形状などが多様な学習画像を用いた場合であっても,対象物を含む領域のみを新たに正例として識別器の学習に利用することが可能となる.また,選択された領域を内包する様々なサイズの局所ブロックも同時に新たな正例として利用することで,対象物を含む正例のバリエーションを増やすことが可能となる.以上により,近年の学習に基づく手法や局所特徴に基づく手法において困難であった,対象物を含む領域の自動選択,および得られる領域に基づく新たな学習画像の生成が可能となり,識別精度の向上が実現される.本文の最後では,提案手法の有効性を確認するため,実画像を用いた比較実験により性能の評価を行う.
  • 映像から取得した人間の動きと楽曲との関係に基づく楽曲推薦手法 : 自動化と高精度化のための検討(ITS画像処理,映像メディア,視覚及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,以前に我々が提案した映像から取得される人間の動きと楽曲の関係に基づく楽曲推薦手法の高精度化と自動化について検討を行う.提案手法では,カーネル正準相関分析に基づく人間の動きと楽曲との関係のモデル化を行う際人間が含まれる領域を予め与える必要がある.そこで,本文では,映像から得られる動き特徴に基づき,人間が撮像されている領域の自動抽出を可能とし,自動で楽曲を推薦することを可能とする.本文の最後では,映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • サッカー映像におけるパス可能領域の推定手法の高精度化に関する考察 : 適応的なパラメータ設定法の導入(ITS画像処理,映像メディア,視覚及び一般)
    高橋 翔, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本稿では,サッカー映像においてパスが可能な領域を推定する際に用いている2つのパラメータ,選手の走行速度およびボールの速度の適応的な設定法を導入することで,より高精度なパス可能領域の推定を実現する.我々はこれまで,ボールの速度や選手の走行速度としてその平均値を用い,選手位置に基づいてパス可能領域の推定を行った.しかしながら,実際のサッカー競技においてパスが行われる場面では,試合の状況や選手の身体能力によってボールおよび選手の速度が大きく異なり,それらは攻撃および守備の選手同士の距離や密度によって変化している.よって,より高精度なパス可能領域の推定を実現するためには,ボールの速度および選手の走行速度を攻撃および守備の選手同士の距離や密度に基づいて適応的に設定する必要がある。そこで,提案手法では,サッカー映像から取得する選手位置を用いて,選手の走行速度およびボールの速度に関するパラメータの適応的な設定を行う.これにより,パス可能領域の推定手法の高精度化が実現される.
  • 顕微鏡画像中に含まれる底生生物の自動分類法 : SVDDを用いた分類の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    長谷川 尭史, 小川 貴弘, 渡邉 日出海, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,Support Vector Data Description(SVDD)を用いた顕微鏡画像中に含まれる生物の自動分類法を提案する.提案手法では,数種類の底生生物の画像を対象としてSVDDを用いた学習を行い,生成された識別器を用いて実際に撮像した顕微鏡画像中に含まれる生物の生物種分類を行う.このとき,SVDDの識別のみでは一度に多くの生物種を高精度に分類することは困難であるため,階層的な分岐処理を導入する.具体的に高精度に識別可能な生物種を順次取り除き生物種を絞り込むことで,複数の生物種を扱った場合でもより高精度な分類を行うことを可能とする.
  • 複数の気象データを用いたフロー推定法の高精度化に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    李 徳智, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,複数の気象データを用いたフロー推定の高精度化に関する検討を行う.提案手法では,雲量のデータから三次元空間におけるフローを推定するため,二次元データを処理するための従来手法を三次元へ拡張する.さらに,風速や上昇流のデータからフロー推定の際の制約条件を新たに設定する.これにより,雲量のみを利用したフロー推定法と比較して,より高精度なフローの算出を可能とする.
  • 映像特徴量を用いたWebコミュニティ抽出手法の高速化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    畠山 泰貴, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,Locality Sensitive Hashingを用いた映像特徴量に基づく高速なWebコミュニティ抽出手法を提案する.提案手法は映像から得られる画像,音響及び映像を含むWebページから得られるテキスト特徴に対し,Locality Sensitive Hashingを施すことで高速に映像間の類似度計算を可能とする.さらに,得られた映像問の類似度と映像を含むWebページのリンク関係に基づいて類似した内容の映像集合であるWebコミュニティの抽出を行う.したがって,提案手法は高速にWebコミュニティの抽出が可能となり,大規模なデータセットに対しても高速な映像検索が実現される.
  • 画像特徴を用いたキーワードの階層化手法とその画像アノテーションへの応用(ITS画像処理,映像メディア,視覚及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    本文では,画像特徴を用いたキーワードの階層化手法を提案し,その画像アノテーションへの応用について検討する.提案手法では,意味的に上位となるキーワードほど,そのキーワードの付与された画像セットにおける画像特徴のばらつきが大きくなることに着目し,以下のアプローチによりキーワードの階層化を行う.まず,あるキーワードに関する画像セットにおいて,画像特徴に基づくクラスタリングを適用する。次に,得られた結果に対し,キーワードの視覚的多様性を表す指標を導入する.具体的に,この指標は,各クラスタにおける画像特徴の分散及びクラスタ間の類似度から算出し,値を降順に並べることで,画像特徴に基づくキーワードの階層化が可能となる.得られた階層性に基づき,まず意味的に下位となるキーワードを画像特徴を用いて推定し,それらのキーワードと強い関係を持つ上位のキーワードを付与することで,画像アノテーションの高精度化が期待される.
  • 購買履歴データ解析によるユーザの嗜好の可視化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    高谷 太紹, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,購買履歴データを解析することで,複数のユーザにより構成されるユーザ集合の嗜好を分析し,それを可視化する手法を提案する.提案手法は,同時に購買された商品の組み合わせから特徴ベクトルを定義し,あらかじめユーザをプロフィールにより分類することで求めたユーザ集合を,互いに比較することでユーザ集合間の嗜好の差異を表現する.提案手法は,Bag-of-Wordsに着想を得たデータ解析を行っており,あるユーザの購買履歴データが十分に得られていない場合でも,そのユーザを含むユーザ集合の購買履歴データを利用し,ユーザ集合の嗜好を推定することが可能となる.さらに,算出されたユーザ集合の嗜好を表す特徴ベクトルに対し,多次元尺度構成法を施すことにより,その嗜好の可視化も可能とする.
  • 簡便な画像処理による交通流計測とその実データへの適用への試み(ITS画像処理,映像メディア,視覚及び一般)
    西野 泰典, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,道路監視カメラにより撮像ざれた映像から走行車両の検出を行い,その検出結果より車速計測,車種判別を行う手法を提案する.提案手法では,日照条件によって,車体またはヘッドライトの光に基づいた,車速計測,車種判別を実現する.また,薄暮時など,短時間で日照が変化する環境下での交通流計測の高精度化を行うために,検出に利用される特徴である車体またはヘッドライトの光を対象の映像より自動で選択する処理を導入する.これにより,薄暮時の映像において,輝度ヒストグラムを用いて昼夜の交通流計測手法を切り替えた場合よりも,頑健な交通流計測が期待される.
  • 複数種類の識別器を用いた電子レセプトデータからの傷病名推定に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    池田 啓典, 畠山 泰貴, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,電子レセプトデータに記載されている診療情報から医療資源を最も投入した傷病名を推定する手法について提案する.提案手法では,医療資源を最も投入した傷病名が明記されているDiagnosis Procedure Combination(DPC)データを教師データとし,診療情報から算出される特徴ベクトルと医療資源を最も投入した傷病名を表すラベルの組を用いて識別器を構築する.これにより,電子レセプトデータから医療資源を最も投入した傷病名の推定が可能となる.また本文では,複数種類の識別器より得られる推定結果を併用することにより,傷病名推定の高精度化について検討する.
  • ぶれにより劣化した低解像度動画像の高解像度化に関する考察 : PSFを用いた事後確率の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,ぶれにより劣化した低解像度動画像に対して,ぶれ関数を推定し,ぶれの除去及び高解像度化を同時に行う手法を提案する.提案手法では,高解像度フレームとぶれ関数の事後確率を定義することで,最大事後確率推定を用いて,それらを同時に推定する.このとき,ぶれ関数については,輝度勾配に注目し,フレーム中から自動で選択したエッジを多く含む領域を用いて,その推定を行う.このように,ぶれ関数の推定に適した領域を用いることで,その精度の向上が期待できる.以上により,提案手法では,ぶれ関数の推定誤差により生じる再構成結果の劣化を抑制し,高精度にぶれの除去及び高解像度化を実現する.
  • 撮像物体の対応を考慮したMCMC法に基づくシーン分割の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,撮像物体の対応を考慮したMarkov Chain Monte Carlo (MCMC)法に基づくシーン分割手法を提案する.提案手法では,映像中に含まれる対象物体の回転,スケール変化及び照明の変化に頑健なSIFT特徴量を用いて,特徴点による物体の対応付けを行い,得られるショット間の類似度に基づいて映像の構造に基づくシーン境界候補の抽出を行う.このとき,SIFTを用いることで,従来の手法で多く用いられる色ヒストグラム特徴量を用いた場合に撮像環境における対象物体の変化が大きいために発生していたシーンの過分割を抑制することが可能となる.さらに,提案手法ではMCMC法に基づいてシーン境界候補から真のシーン境界を推定する.このとき,映像の構造に注目して,シーン分割を行うことにより,従来のMCMC法を用いた手法に比べ,映像の構造を明確に持つ映像コンテンツのシーン分割が可能となる.本文の最後では,実際にテレビで放送された映像に対して提案手法を適用し,その有効性を確認する.さらに,提案手法及び従来手法で用いられる各特徴量がシーン分割に与える影響について考察を行う.
  • 顕微鏡画像中に含まれる底生生物の自動分類法 : SVDDを用いた分類の高精度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    長谷川 尭史, 小川 貴弘, 渡邉 日出海, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,Support Vector Data Description(SVDD)を用いた顕微鏡画像中に含まれる生物の自動分類法を提案する.提案手法では,数種類の底生生物の画像を対象としてSVDDを用いた学習を行い,生成された識別器を用いて実際に撮像した顕微鏡画像中に含まれる生物の生物種分類を行う.このとき,SVDDの識別のみでは一度に多くの生物種を高精度に分類することは困難であるため,階層的な分岐処理を導入する.具体的に高精度に識別可能な生物種を順次取り除き生物種を絞り込むことで,複数の生物種を扱った場合でもより高精度な分類を行うことを可能とする.
  • 複数の気象データを用いたフロー推定法の高精度化に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    李 徳智, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,複数の気象データを用いたフロー推定の高精度化に関する検討を行う.提案手法では,雲量のデータから三次元空間におけるフローを推定するため,二次元データを処理するための従来手法を三次元へ拡張する.さらに,風速や上昇流のデータからフロー推定の際の制約条件を新たに設定する.これにより,雲量のみを利用したフロー推定法と比較して,より高精度なフローの算出を可能とする.
  • 対象物検出機能を含むSVDDに基づく識別器の高精度化に関する一検討(ITS画像処理,映像メディア,視覚及び一般)
    岡田 周史, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,対象物検出機能を含むSVDDに基づく識別器の高精度化手法を提案する.提案手法では,対象物を含む学習画像からSVDDにより算出される超球の中心からの距離に基づいて,対象物を含む領域を自動で選択し,新たな学習画像を生成する.これにより,対象物の位置や向き,大きさ,形状などが多様な学習画像を用いた場合であっても,対象物を含む領域のみを新たに正例として識別器の学習に利用することが可能となる.また,選択された領域を内包する様々なサイズの局所ブロックも同時に新たな正例として利用することで,対象物を含む正例のバリエーションを増やすことが可能となる.以上により,近年の学習に基づく手法や局所特徴に基づく手法において困難であった,対象物を含む領域の自動選択,および得られる領域に基づく新たな学習画像の生成が可能となり,識別精度の向上が実現される.本文の最後では,提案手法の有効性を確認するため,実画像を用いた比較実験により性能の評価を行う.
  • 映像から取得した人間の動きと楽曲との関係に基づく楽曲推薦手法 : 自動化と高精度化のための検討(ITS画像処理,映像メディア,視覚及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,以前に我々が提案した映像から取得される人間の動きと楽曲の関係に基づく楽曲推薦手法の高精度化と自動化について検討を行う.提案手法では,カーネル正準相関分析に基づく人間の動きと楽曲との関係のモデル化を行う際,人間が含まれる領域を予め与える必要がある.そこで,本文では,映像から得られる動き特徴に基づき,人間が撮像されている領域の自動抽出を可能とし,自動で楽曲を推薦することを可能とする.本文の最後では,映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • サッカー映像におけるパス可能領域の推定手法の高精度化に関する考察 : 適応的なパラメータ設定法の導入(ITS画像処理,映像メディア,視覚及び一般)
    高橋 翔, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本稿では,サッカー映像においてパスが可能な領域を推定する際に用いている2つのパラメータ,選手の走行速度およびボールの速度の適応的な設定法を導入することで,より高精度なパス可能領域の推定を実現する.我々はこれまで,ボールの速度や選手の走行速度としてその平均値を用い,選手位置に基づいてパス可能領域の推定を行った.しかしながら,実際のサッカー競技においてパスが行われる場面では,試合の状況や選手の身体能力によってボールおよび選手の速度が大きく異なり,それらは攻撃および守備の選手同士の距離や密度によって変化している.よって,より高精度なパス可能領域の推定を実現するためには,ボールの速度および選手の走行速度を攻撃および守備の選手同士の距離や密度に基づいて適応的に設定する必要がある.そこで,提案手法では,サッカー映像から取得する選手位置を用いて,選手の走行速度およびボールの速度に関するパラメータの適応的な設定を行う,これにより,パス可能領域の推定手法の高精度化が実現される.
  • 映像特徴量を用いたWebコミュニティ抽出手法の高速化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    畠山 泰貴, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,Locality Sensitive Hashingを用いた映像特徴量に基づく高速なWebコミュニティ抽出手法を提案する.提案手法は映像から得られる画像,音響及び映像を含むWebページから得られるテキスト特徴に対し,Locality Sensitive Hashingを施すことで高速に映像間の類似度計算を可能とする.さらに,得られた映像間の類似度と映像を含むWebページのリンク関係に基づいて類似した内容の映像集合であるWebコミュニティの抽出を行う.したがって,提案手法は高速にWebコミュニティの抽出が可能となり,大規模なデータセットに対しても高速な映像検索が実現される.
  • 画像特徴を用いたキーワードの階層化手法とその画像アノテーションへの応用(ITS画像処理,映像メディア,視覚及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    本文では,画像特徴を用いたキーワードの階層化手法を提案し,その画像アノテーションへの応用について検討する.提案手法では,意味的に上位となるキーワードほど,そのキーワードの付与された画像セットにおける画像特徴のばらつきが大きくなることに着目し,以下のアプローチによりキーワードの階層化を行う.まず,あるキーワードに関する画像セットにおいて,画像特徴に基づくクラスタリングを適用する。次に,得られた結果に対し,キーワードの視覚的多様性を表す指標を導入する.具体的に,この指標は,各クラスタにおける画像特徴の分散及びクラスタ間の類似度から算出し,値を降順に並べることで,画像特徴に基づくキーワードの階層化が可能となる.得られた階層性に基づき,まず意味的に下位となるキーワードを画像特徴を用いて推定し,それらのキーワードと強い関係を持つ上位のキーワードを付与することで,画像アノテーションの高精度化が期待される.
  • 回路理論による1次元格子振動の解析に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    任 捷, 永井 信夫, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2011年02月14日, 日本語
    1次元格子振動は運動方程式で表され,その方程式は差分方程式で表される.差分方程式は回路理論を用いると,等価回路としてLC梯子形回路が得られる.ここに,Lはインダクタンスを表し,Cはキャパシタンスを表す.本文では差分方程式から得られるLC梯子形等価回路を利用して,一次元格子振動の特徴を回路解析手法を応用し,固有振動を共鳴現象の終端を開放や短絡の状態として求める.
  • 回路理論による1次元格子振動の解析に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    任 捷, 永井 信夫, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2011年02月14日, 日本語
    1次元格子振動は運動方程式で表され,その方程式は差分方程式で表される.差分方程式は回路理論を用いると,等価回路としてLC梯子形回路が得られる.ここに,Lはインダクタンスを表し,Cはキャパシタンスを表す.本文では差分方程式から得られるLC梯子形等価回路を利用して,一次元格子振動の特徴を回路解析手法を応用し,固有振動を共鳴現象の終端を開放や短絡の状態として求める.
  • 回路理論による1次元格子振動の解析に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    任 捷, 永井 信夫, 長谷山 美紀
    映像情報メディア学会技術報告, 2011年02月14日, 日本語
    1次元格子振動は運動方程式で表され,その方程式は差分方程式で表される.差分方程式は回路理論を用いると,等価回路としてLC梯子形回路が得られる.ここに,Lはインダクタンスを表し,Cはキャパシタンスを表す.本文では差分方程式から得られるLC梯子形等価回路を利用して,一次元格子振動の特徴を回路解析手法を応用し,固有振動を共鳴現象の終端を開放や短絡の状態として求める.
  • 固有空間BPLP法の補間精度に関する解析(ディジタル信号処理)
    田中 章, 小川 貴弘, 長谷山 美紀, 宮腰 政明
    電子情報通信学会論文誌. A, 基礎・境界, 2011年02月01日, 日本語
    欠損領域を有する数値データの補間技術として, 固有空間BPLP(Back Projection for Lost Pixels)法, 及び, その改良手法が提案されている.これらの手法は, 所与のデータから切り出したブロックデータの主成分構造を利用して欠損領域を推定する手法であり, 主要な固有空間の次元等を適切に選択することによって, 効果的に欠損部を補間することができる.一方, 重要なパラメータの一つである, 主要な固有空間の次元の選択の指針はこれまで与えられていなかった.本論文では, 主成分分析に用いる分散共分散行列と欠損ブロックに対応する分散共分散行列が等しいという理想的な条件下では, 固有空間BPLP法の改良手法の, 期待二乗誤差最小の意味での最適解が古典的なウィーナーフィルタであることを指摘するとともに, 固有空間として全空間を用いた解が, 上で述べた最適解であるウィーナーフィルタによる解に帰着することを示し, 結果として固有空間の最適な次元がブロックの次元そのものであることを示す.また, 主成分分析に用いる分散共分散行列と欠損ブロックに対応する分散共分散行列が完全に一致しない場合についても考察し, 上記理想的な条件下同様, 固有空間として全空間を採用することが最適となる十分条件を与える.また, 当該十分条件を満たさない場合についても, 数値実験によりウィーナーフィルタによる解の優位性を確認する.
  • 足跡を用いた男女識別--足跡の特徴量からSVMにより男女を識別する試み
    浅水 仁, 長谷山 美紀
    画像ラボ, 2011年01月, 日本語
  • Human-Centric Navigation System Video Vortex for Video Retrieval               
    2011 IEEE International Conference on Consumer Electronics, 2011年
  • Missing Intensity Interpolation Using a Kernel PCA-Based POCS Algorithm and Its Applications
    OGAWA Takahiro, HASEYAMA Miki
    IEEE Transactions on Image Processing, 2011年
  • Linear Time Decoding of Real-Field Codes over High Error Rate Channels               
    IEEE International Conference on AcousticsSpeech, and Signal Processing 2011, 2011年
  • Adaptive Reconstruction Method of Missing Textures Based on Perceptually Optimized Algotithm               
    IEEE International Conference on AcousticsSpeech, and Signal Processing 2011, 2011年
  • Adaptive KPCA-Based Missing Texture Reconstruction Approach Including Classification Scheme via Difference Subspaces               
    IEEE International Conference on Image Processing(ICIP 2011), 2011年
  • Cross Low-dimension Pursuit for Sparse Signal Recovery from Incomplete Measurements Based on Permuted Block Diagonal Matrix
    IEICE Trans. Fundamentals of Electronics, Communications and Computer Sciences, 2011年
  • 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討(システムと信号処理及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CST, コンカレント工学, 2010年06月14日, 日本語
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo (MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する.
  • ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定(システムと信号処理及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CST, コンカレント工学, 2010年06月14日, 日本語
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる.
  • 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用(システムと信号処理及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CST, コンカレント工学, 2010年06月14日, 日本語
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード間の関係を導入することで,画像アノテーションの高精度化を実現する.
  • カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討(システムと信号処理及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CST, コンカレント工学, 2010年06月14日, 日本語
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との間の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • CAS2010-21 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討(システムと信号処理及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2010年06月14日, 日本語
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo(MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する.
  • CAS2010-20 ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定(システムと信号処理及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2010年06月14日, 日本語
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる.
  • CAS2010-19 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用(システムと信号処理及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2010年06月14日, 日本語
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード問の関係を導入することで,画像アノテーションの高精度化を実現する.
  • CAS2010-12 カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討(システムと信号処理及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2010年06月14日, 日本語
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との問の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討(システムと信号処理及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2010年06月14日, 日本語
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo (MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する.
  • ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定(システムと信号処理及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2010年06月14日, 日本語
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる.
  • 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用(システムと信号処理及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2010年06月14日, 日本語
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード間の関係を導入することで,画像アノテーションの高精度化を実現する.
  • カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討(システムと信号処理及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2010年06月14日, 日本語
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との間の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • カーネル正準相関分析に基づく人間の動きに適した楽曲の推薦に関する一検討(システムと信号処理及び一般)
    大串 裕幸, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2010年06月14日, 日本語
    本文では,正準相関分析に基づいて人間の動きに適した楽曲を推薦する手法を提案する.提案手法では,人間の動きと楽曲間の関係をモデル化するためにカーネル正準相関分析を利用する.このとき,カーネル正準相関分析において用いるカーネル関数は,人間の動き,楽曲共に各々の時間の伸縮を許容するように定義する必要がある.そこで,提案手法ではまず,人間の動きにおける時間の伸縮を許容するための再検討を行う.これにより,人間の動きと楽曲との間の関係が適切にモデル化され,その結果に基づいて人間の動きに適した楽曲の推薦が可能となる.本文の最後では,実際の映像から取得した人間の動きから楽曲を推薦する実験を行い,その有効性の確認を行う.
  • ぶれによる劣化動画像の復元および高解像度化の同時実現に関する一検討 : 超解像処理における事前確率分布の推定(システムと信号処理及び一般)
    和泉 大佑, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2010年06月14日, 日本語
    本文では,超解像処理を用いて,ぶれにより劣化した動画像の復元及び高解像度化を同時に行う手法を提案する.提案手法では,MAP推定による復元及び高解像度化に必要となる高解像度フレームの事前確率分布を輝度勾配に着目することで,局所領域毎に推定する.これにより,エッジを含む領域において,高解像度画像の輝度勾配が小さくなることを抑制し,再構成結果における過剰な平滑化が抑制される.また,平坦部においては,劣化画像を用いて輝度勾配が大きくなることを抑制し,再構成結果におけるエッジ周辺の平坦部に発生するリンギングを抑制する.以上により,復元および高解像度化を行う場合に発生する過剰な平滑化とリンギングの両者を抑制した復元及び高解像度化の同時実現が可能となる.
  • 映像の構造に注目したMCMC法によるシーン分割の高精度化に関する検討(システムと信号処理及び一般)
    宋 妍, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2010年06月14日, 日本語
    本文では,映像の繰り返し構造に注目したMarkov Chain Monte Carlo (MCMC)法によるシーン分割手法を提案する.提案手法では,映像の構造に基づいてショット境界からシーン境界候補を抽出し,それらの中から映像中の画像特徴量に基づくMCMC法により真のシーン境界を選択する.映像の構造に注目して,シーン分割を行うことにより,従来のMCMCを用いた手法に比べ,映像の構造を有効に利用したシーン分割が可能となる.尚,MCMC法による従来のシーン分割手法では映像中に存在するシーンの総数に関する事前確率を求める必要があるが,提案手法ではその確率に含まれるパラメータの推定を学習映像を用いた重回帰分析により行う.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する.
  • 画像特徴に基づくキーワードの関係抽出とその画像アノテーションへの応用(システムと信号処理及び一般)
    桂井 麻里衣, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2010年06月14日, 日本語
    本文では,画像特徴を用いたキーワードの関係抽出と,それを応用した画像アノテーション手法を提案する.提案手法では,関係の強いキーワードが画像特徴を共有することに着目し,以下のアプローチによりキーワードの関係を抽出する.まず,クラス分類のための一手法であるロジスティック回帰モデルを用いて画像特徴と各キーワードの間の関係を学習する.次に,あるキーワードに関連する画像特徴が取り除かれることによる他のキーワードへの影響の大きさを,両者が画像特徴を共有する度合とみなし,これに基づきキーワード間の関係の強さを算出する.提案手法は,以上のように画像特徴を用いてキーワード間の関係の強さを算出することで,従来よりも画像アノテーションに適したキーワードの関係抽出を可能とする.さらに,画像特徴のみを用いて行われたアノテーション結果に対し,得られたキーワード間の関係を導入することで,画像アノテーションの高精度化を実現する.
  • アクティブグリッドを用いたサッカー映像における3次元パス可能領域の推定に関する一考察(ITS画像処理,映像メディア,視覚および一般)
    高橋 翔, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本稿では,アクティブグリッドを用いてサッカー映像からパスが可能な3次元領域を推定する手法を提案する.これまで,我々はサッカーフィールド上に推定されるボールの位置や選手位置を用い,パス可能領域をサッカーフィールド上に2次元の領域として推定した.しかしながら,パスコースは3次元空間上に存在するため,より高精度にパス可能領域を推定するためには3次元の領域として推定する必要がある.そこで,提案手法では,選手とボールの位置を用いて選手が移動可能な3次元空間を定式化し,3次元のボリュームデータを生成することで,領域抽出手法であるアクティブグリッドの適用を可能とする.これにより,アクティブグリッドを用いた3次元のパス可能領域推定が実現される.
  • 道路監視カメラ映像の交通流計測に関する一考察 : 撮影環境の変化による精度低下の抑制に関する検討(ITS画像処理,映像メディア,視覚および一般)
    村山 聖太, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本文では,道路監視カメラにより撮影された映像に対して,撮影環境の変化による精度低下を抑制した交通流の計測を行う手法を提案する.提案手法では,車線内を走行する車両を,車体やヘッドライトの濃度値に基づいて検出する.その際,車両領域の存在および通過を判定するために用いるパラメータは,天候の変化に伴う照度変化に合わせて適切に設定する必要がある.そこで,提案手法では,照度と関連が強い画像特徴を用いて,重回帰分析によりパラメータを推定する.これにより,撮影環境が異なる映像においても,適用可能となるようにパラメータが設定され,高精度な交通流計測が期待される.
  • 個人の嗜好に基づいた楽曲の推薦に関する一検討 : 嗜好に関するモデルの類似性を表す指標の導入(ITS画像処理,映像メディア,視覚および一般)
    小林 和也, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本文では,個人の嗜好の類似性に注目した新たな楽曲推薦手法を提案する.提案手法ではまず,ユーザ毎に好みに関する評価が行われている楽曲を教師データとし,それらから算出される特徴ベクトルに対してSupport Vector Data Description(SVDD)を適用することで,好みの楽曲を識別する超球をユーザ毎に算出する.ここで,提案手法ではユーザ間における嗜好の類似性を表す指標を新たに定義し,この指標に基づいて嗜好の類似するユーザの組み合わせを選択する.次に,提案手法では推薦対象ユーザに対する超球の中心とテストデータとして与えられるデータベース内の特徴ベクトルとの距離に基づいて算出される確率,及び選択された嗜好の類似するユーザの超球を用いて同様に算出される確率に基づいて,推薦結果を出力する.その結果,提案手法はユーザ間における嗜好の類似性に注目した高精度な楽曲推薦が期待できる.
  • Webコミュニティ抽出に基づく映像検索手法の高精度化に関する検討 : 映像の類似性に注目したクラスタリング手法の導入(ITS画像処理,映像メディア,視覚および一般)
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本文では,映像の類似性に注目したクラスタリング手法を導入したWebコミュニティ抽出に基づく高精度な検索手法を提案する.提案手法では,映像及びその映像を含むWebページから得られる特徴の類似性に基づき,重み付けを行ったリンク関係にリンク解析を施し,類似した映像を含むWebページの集合であるWebコミュニティを抽出する.さらに,抽出されたWebコミュニティ内に含まれる映像の類似性に基づいてクラスタリングを行う.これにより,ユーザはWebコミュニティから得られた類似した特徴の映像を含むクラスタを用いて効果的に検索することが可能となる.したがって,提案手法は類似した内容と特徴を持つ映像の効果的な検索を実現する.
  • PLSAを用いた映像の構造解析に基づくシーン分割手法の高精度化 : Sequence Alignmentの導入による新たな類似度の定義(ITS画像処理,映像メディア,視覚および一般)
    山本 誠, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本文では,映像中に存在する連続した複数のショットに注目した構造解析に基づき,高精度なシーン分割を可能とする手法を提案する.提案手法では,Sequence Alignmentの一手法であるDynamic Time Warping(DTW)により複数ショット間において伸縮を許容した類似度の算出を可能とし,これを用いることで構造解析を行う.このとき,映像中のショットから得られる特徴量に対してProbabilistic Latent Semantic Analysis(PLSA)を適用し,得られる結果を用いて新たにDTWのコストを定義する.以上により,複数ショットの類似性に注目した高度な構造解析が可能となり,提案手法では高精度なシーン分割が実現される.
  • 群化の性質に基づいた連想型映像検索の定量評価に関する検討(ITS画像処理,映像メディア,視覚および一般)
    徳本 了太, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本稿では,ゲシュタルト心理学における群化の性質に基づき,連想型映像検索結果を定量的に評価する評価値を提案する.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する連想型映像検索システムを提案した.しかしながら,この手法では検索結果の定量的評価に至ることができなかった.そこで,本稿では,連想型映像検索結果を評価するためのモデルを定義する.そのモデルにおいて形成される映像の群を群化とし,その程度を表す定量値を算出する.さらに,定量値を用いて連想型映像検索結果の有効性を評価するための評価値を定義する.その評価値の大小を比較することで,連想型映像検索結果の定量的な評価が可能となる.
  • バレーボール映像における選手及びボールの追跡とそのイベント推定への応用(ITS画像処理,映像メディア,視覚および一般)
    高橋 茂樹, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本文では,バレーボール映像における新たなボール追跡手法を提案し,レシーブやトス等の試合中のイベント推定への応用について検討を行なう.提案するボール追跡手法では,まず,バレーボール映像中において選手間でボールが放物運動を行なう点に着目し,追跡された選手位置に基づいたボールの軌跡を求める.次に,提案手法は,得られたボールの軌跡を用いることで,その追跡と共にイベント推定において重要となるボールに接触した選手とその時刻の取得を可能とする.さらに,我々は,バレーボールのルールに基づいて,提案手法をイベント推定へ応用する方法について検討を行なう.本文の最後では,実際のバレーボール映像を用いた実験を行い,提案手法の有効性を確認する.
  • 3次元モデルによるパラメトリック固有空間法を用いた多関節物体の姿勢推定の高度化に関する検討(ITS画像処理,映像メディア,視覚および一般)
    角野 公亮, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2010年02月15日, 日本語
    本文では,パラメトリック固有空間法を用いて2次元の画像中に存在する多関節物体の姿勢を推定する手法を提案する.提案手法では,多関節物体の3次元モデルから様々な姿勢でのシルエット画像を生成し,それらの画素値をデータとして固有ベクトルを求め,固有空間を得る.次に,各シルエット画像を固有空間上の点に投影し,点の補間を行うことで,姿勢の連続的な変化を表す多様体を構成する.さらに,入力画像に撮像された姿勢推定対象の多関節物体のシルエット画像を固有空間に投影し,多様体上の点との距離を観察することで,最適なパラメータを推定する.このとき,多関節物体を木構造とみなし,根元から末端に向かって段階的にパラメータの最適解を求める事で,計算コストを削減した姿勢推定を実現する.
  • アクティブグリッドを用いたサッカー映像における3次元パス可能領域の推定に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    高橋 翔, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本稿では,アクティブグリッドを用いてサッカー映像からパスが可能な3次元領域を推定する手法を提案する.これまで,我々はサッカーフィールド上に推定されるボールの位置や選手位置を用い,パス可能領域をサッカーフィールド上に2次元の領域として推定した.しかしながら,パスコースは3次元空間上に存在するため,より高精度にパス可能領域を推定するためには3次元の領域として推定する必要がある.そこで,提案手法では,選手とボールの位置を用いて選手が移動可能な3次元空間を定式化し,3次元のボリュームデータを生成することで,領域抽出手法であるアクティブグリッドの適用を可能とする.これにより,アクティブグリッドを用いた3次元のパス可能領域推定が実現される.
  • 道路監視カメラ映像の交通流計測に関する一考察 : 撮影環境の変化による精度低下の抑制に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    村山 聖太, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本文では,道路監視カメラにより撮影された映像に対して,撮影環境の変化による精度低下を抑制した交通流の計測を行う手法を提案する.提案手法では,車線内を走行する車両を,車体やヘッドライトの濃度値に基づいて検出する.その際車両領域の存在および通過を判定するために用いるパラメータは,天候の変化に伴う照度変化に合わせて適切に設定する必要がある.そこで,提案手法では,照度と関連が強い画像特徴を用いて,重回帰分析によりパラメータを推定する.これにより,撮影環境が異なる映像においても,適用可能となるようにパラメータが設定され,高精度な交通流計測が期待される.
  • 個人の嗜好に基づいた楽曲の推薦に関する一検討 : 嗜好に関するモデルの類似性を表す指標の導入(ITS画像処理,映像メディア,視覚及び一般)
    小林 和也, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本文では,個人の嗜好の類似性に注目した新たな楽曲推薦手法を提案する.提案手法ではまず,ユーザ毎に好みに関する評価が行われている楽曲を教師データとし,それらから算出される特徴ベクトルに対してSupport Vector Data Description (SVDD)を適用することで,好みの楽曲を識別する超球をユーザ毎に算出する.ここで,提案手法ではユーザ間における嗜好の類似性を表す指標を新たに定義し,この指標に基づいて嗜好の類似するユーザの組み合わせを選択する.次に,提案手法では推薦対象ユーザに対する超球の中心とテストデータとして与えられるデータベース内の特徴ベクトルとの距離に基づいて算出される確率,及び選択された嗜好の類似するユーザの超球を用いて同様に算出される確率に基づいて,推薦結果を出力する.その結果,提案手法はユーザ問における嗜好の類似性に注目した高精度な楽曲推薦が期待できる.
  • Webコミュニティ抽出に基づく映像検索手法の高精度化に関する検討 : 映像の類似性に注目したクラスタリング手法の導入(ITS画像処理,映像メディア,視覚及び一般)
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本文では,映像の類似性に注目したクラスタリング手法を導入したWebコミュニティ抽出に基づく高精度な検索手法を提案する.提案手法では,映像及びその映像を含むWebページから得られる特徴の類似性に基づき,重み付けを行ったリンク関係にリンク解析を施し,類似した映像を含むWebページの集合であるWebコミュニティを抽出する.さらに,抽出されたWebコミュニティ内に含まれる映像の類似性に基づいてクラスタリングを行う.これにより,ユーザはWebコミュニティから得られた類似した特徴の映像を含むクラスタを用いて効果的に検索することが可能となる.したがって,提案手法は類似した内容と特徴を持つ映像の効果的な検索を実現する.
  • PLSAを用いた映像の構造解析に基づくシーン分割手法の高精度化 : Sequence Alignmentの導入による新たな類似度の定義(ITS画像処理,映像メディア,視覚及び一般)
    山本 誠, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本文では,映像中に存在する連続した複数のショットに注目した構造解析に基づき,高精度なシーン分割を可能とする手法を提案する.提案手法では,Sequence Alignmentの一手法であるDynamic Time Warping (DTW)により複数ショット間において伸縮を許容した類似度の算出を可能とし,これを用いることで構造解析を行う.このとき,映像中のショットから得られる特徴量に対してProbabilistic Latent Semantic Analysis (PLSA)を適用し,得られる結果を用いて新たにDTWのコストを定義する.以上により,複数ショットの類似性に注目した高度な構造解析が可能となり,提案手法では高精度なシーン分割が実現される.
  • 群化の性質に基づいた連想型映像検索の定量評価に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    徳本 了太, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本稿では,ゲシュタルト心理学における群化の性質に基づき,連想型映像検索結果を定量的に評価する評価値を提案する.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する連想型映像検索システムを提案した.しかしながら,この手法では検索結果の定量的評価に至ることができなかった.そこで,本稿では,連想型映像検索結果を評価するためのモデルを定義する.そのモデルにおいて形成される映像の群を群化とし,その程度を表す定量値を算出する.さらに,定量値を用いて連想型映像検索結果の有効性を評価するための評価値を定義する.その評価値の大小を比較することで,連想型映像検索結果の定量的な評価が可能となる.
  • バレーボール映像における選手及びボールの追跡とそのイベント推定への応用(ITS画像処理,映像メディア,視覚及び一般)
    高橋 茂樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本文では,バレーボール映像における新たなボール追跡手法を提案し,レシーブやトス等の試合中のイベント推定への応用について検討を行なう.提案するボール追跡手法では,まず,バレーボール映像中において選手間でボールが放物運動を行なう点に着目し,追跡された選手位置に基づいたボールの軌跡を求める.次に,提案手法は,得られたボールの軌跡を用いることで,その追跡と共にイベント推定において重要となるボールに接触した選手とその時刻の取得を可能とする.さらに,我々は,バレーボールのルールに基づいて,提案手法をイベント推定へ応用する方法について検討を行なう。本文の最後では,実際のバレーボール映像を用いた実験を行い,提案手法の有効性を確認する.
  • 3次元モデルによるパラメトリック固有空間法を用いた多関節物体の姿勢推定の高度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    角野 公亮, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2010年02月08日, 日本語
    本文では,パラメトリック固有空間法を用いて2次元の画像中に存在する多関節物体の姿勢を推定する手法を提案する.提案手法では,多関節物体の3次元モデルから様々な姿勢でのシルエット画像を生成し,それらの画素値をデータとして固有ベクトルを求め,固有空間を得る.次に,各シルエット画像を固有空間上の点に投影し,点の補間を行うことで,姿勢の連続的な変化を表す多様体を構成する.さらに,入力画像に撮像された姿勢推定対象の多関節物体のシルエット画像を固有空間に投影し,多様体上の点との距離を観察することで,最適なパラメータを推定する.このとき,多関節物体を木構造とみなし,根元から末端に向かって段階的にパラメータの最適解を求める事で,計算コストを削減した姿勢推定を実現する.
  • アクティブグリッドを用いたサッカー映像における3次元パス可能領域の推定に関する一考察(ITS画像処理,映像メディア,視覚及び一般)
    高橋 翔, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本稿では,アクティブグリッドを用いてサッカー映像からパスが可能な3次元領域を推定する手法を提案する.これまで,我々はサッカーフィールド上に推定されるボールの位置や選手位置を用い,パス可能領域をサッカーフィールド上に2次元の領域として推定した.しかしながら,パスコースは3次元空間上に存在するため,より高精度にパス可能領域を推定するためには3次元の領域として推定する必要がある.そこで,提案手法では,選手とボールの位置を用いて選手が移動可能な3次元空間を定式化し,3次元のボリュームデータを生成することで,領域抽出手法であるアクティブグリッドの適用を可能とする.これにより,アクティブグリッドを用いた3次元のパス可能領域推定が実現される.
  • 道路監視カメラ映像の交通流計測に関する一考察 : 撮影環境の変化による精度低下の抑制に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    村山 聖太, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本文では,道路監視カメラにより撮影された映像に対して,撮影環境の変化による精度低下を抑制した交通流の計測を行う手法を提案する.提案手法では,車線内を走行する車両を,車体やヘッドライトの濃度値に基づいて検出する.その際,車両領域の存在および通過を判定するために用いるパラメータは,天候の変化に伴う照度変化に合わせて適切に設定する必要がある.そこで,提案手法では,照度と関連が強い画像特徴を用いて,重回帰分析によりパラメータを推定する.これにより,撮影環境が異なる映像においても,適用可能となるようにパラメータが設定され,高精度な交通流計測が期待される.
  • 個人の嗜好に基づいた楽曲の推薦に関する一検討 : 嗜好に関するモデルの類似性を表す指標の導入(ITS画像処理,映像メディア,視覚及び一般)
    小林 和也, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本文では,個人の嗜好の類似性に注目した新たな楽曲推薦手法を提案する.提案手法ではまず,ユーザ毎に好みに関する評価が行われている楽曲を教師データとし,それらから算出される特徴ベクトルに対してSupport Vector Data Description(SVDD)を適用することで,好みの楽曲を識別する超球をユーザ毎に算出する.ここで,提案手法ではユーザ間における嗜好の類似性を表す指標を新たに定義し,この指標に基づいて嗜好の類似するユーザの組み合わせを選択する.次に,提案手法では推薦対象ユーザに対する超球の中心とテストデータとして与えられるデータベース内の特徴ベクトルとの距離に基づいて算出される確率,及び選択された嗜好の類似するユーザの超球を用いて同様に算出される確率に基づいて,推薦結果を出力する.その結果,提案手法はユーザ間における嗜好の類似性に注目した高精度な楽曲推薦が期待できる.
  • Webコミュニティ抽出に基づく映像検索手法の高精度化に関する検討 : 映像の類似性に注目したクラスタリング手法の導入(ITS画像処理,映像メディア,視覚及び一般)
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本文では,映像の類似性に注目したクラスタリング手法を導入したWebコミュニティ抽出に基づく高精度な検索手法を提案する.提案手法では,映像及びその映像を含むWebページから得られる特徴の類似性に基づき,重み付けを行ったリンク関係にリンク解析を施し,類似した映像を含むWebページの集合であるWebコミュニティを抽出する.さらに,抽出されたWebコミュニティ内に含まれる映像の類似性に基づいてクラスタリングを行う.これにより,ユーザはWebコミュニティから得られた類似した特徴の映像を含むクラスタを用いて効果的に検索することが可能となる.したがって,提案手法は類似した内容と特徴を持つ映像の効果的な検索を実現する.
  • PLSAを用いた映像の構造解析に基づくシーン分割手法の高精度化 : Sequebce Alignmentの導入による新たな類似度の定義(ITS画像処理,映像メディア,視覚及び一般)
    山本 誠, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本文では,映像中に存在する連続した複数のショットに注目した構造解析に基づき,高精度なシーン分割を可能とする手法を提案する.提案手法では,Sequence Alignmentの一手法であるDynamic Time Warping(DTW)により複数ショット間において伸縮を許容した類似度の算出を可能とし,これを用いることで構造解析を行う.このとき,映像中のショットから得られる特徴量に対してProbabilistic Latent Semantic Analysis(PLSA)を適用し,得られる結果を用いて新たにDTWのコストを定義する.以上により,複数ショットの類似性に注目した高度な構造解析が可能となり,提案手法では高精度なシーン分割が実現される.
  • 群化の性質に基づいた連想型映像検索の定量評価に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    徳本 了太, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本稿では,ゲシュタルト心理学における群化の性質に基づき,連想型映像検索結果を定量的に評価する評価値を提案する.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する連想型映像検索システムを提案した.しかしながら,この手法では検索結果の定量的評価に至ることができなかった.そこで,本稿では,連想型映像検索結果を評価するためのモデルを定義する.そのモデルにおいて形成される映像の群を群化とし,その程度を表す定量値を算出する.さらに,定量値を用いて連想型映像検索結果の有効性を評価するための評価値を定義する.その評価値の大小を比較することで,連想型映像検索結果の定量的な評価が可能となる.
  • バレーボール映像における選手及びボールの追跡とそのイベント推定への応用(ITS画像処理,映像メディア,視覚及び一般)
    高橋 茂樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本文では,バレーボール映像における新たなボール追跡手法を提案し,レシーブやトス等の試合中のイベント推定への応用について検討を行なう.提案するボール追跡手法では,まず,バレーボール映像中において選手間でボールが放物運動を行なう点に着目し,追跡された選手位置に基づいたボールの軌跡を求める.次に,提案手法は,得られたボールの軌跡を用いることで,その追跡と共にイベント推定において重要となるボールに接触した選手とその時刻の取得を可能とする.さらに,我々は,バレーボールのルールに基づいて,提案手法をイベント推定へ応用する方法について検討を行なう.本文の最後では,実際のバレーボール映像を用いた実験を行い,提案手法の有効性を確認する.
  • 3次元モデルによるパラメトリック固有空間法を用いた多関節物体の姿勢推定の高度化に関する検討(ITS画像処理,映像メディア,視覚及び一般)
    角野 公亮, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2010年02月08日, 日本語
    本文では,パラメトリック固有空間法を用いて2次元の画像中に存在する多関節物体の姿勢を推定する手法を提案する.提案手法では,多関節物体の3次元モデルから様々な姿勢でのシルエット画像を生成し,それらの画素値をデータとして固有ベクトルを求め,固有空間を得る.次に,各シルエット画像を固有空間上の点に投影し,点の補間を行うことで,姿勢の連続的な変化を表す多様体を構成する.さらに,入力画像に撮像された姿勢推定対象の多関節物体のシルエット画像を固有空間に投影し,多様体上の点との距離を観察することで,最適なパラメータを推定する.このとき,多関節物体を木構造とみなし,根元から末端に向かって段階的にパラメータの最適解を求める事で,計算コストを削減した姿勢推定を実現する.
  • An fast Web community extraction using LSH-based Web video features and its application               
    Workshop on Picture Coding and Image Processing, PCSJ2010/IMPS2010, 2010年
  • Players tracking approach using level-set method based on color components of players in soccer videos               
    Workshop on Picture Coding and Image Processing, PCSJ2010/IMPS2010, 2010年
  • フレームの再構成に基づくDVCの符号化効率向上に関する検討 : 誤り訂正に基づくKeyフレーム及びWyner-Zivフレームの再構成の導入(感性とメディア及び一般)
    高橋 茂樹, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年10月26日, 日本語
    本文では,distributed video coding(DVC)の符号化効率向上を可能とする手法を提案する.提案手法では,符号化前にKeyフレームに対して消失領域を発生させることで符号量の削減を行う.また,提案手法の復号器では,消失領域を補間し,さらに,Wyner-Zivフレーム(WZフレーム)の復号の際の誤り訂正に基づき,WZフレーム及び隣接するKeyフレームを再構成する.その結果,WZフレームの復号結果がより高精度に再構成されると共に,Keyフレームにおける消失領域の補間誤差が効果的に低減され,従来のDVCに比べ高いRate-Distortion(RD)性能を実現することが可能となる.本文の最後では,実験を行い提案手法の有効性を示す.
  • 群化に基づいた映像検索結果の可視化に関する検討(感性とメディア及び一般)
    徳本 了太, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年10月26日, 日本語
    本文では,ゲシュタルト心理学における群化の性質に基づき,検索履歴を考慮して映像検索結果を可視化する手法を提案する.群化とは,視野に存在する複数の図形をある一定のまとまりとして認識する人間の知覚現象である.以前,我々はユーザが検索を行うためのクエリを具体的に想像することが困難な場合でも,繰り返し検索を行うことでユーザが望む映像を提示する映像検索システムを提案した.しかしながら,従来手法におけるインターフェースでは過去の検索履歴を考慮した可視化が行われていない.そのため,ユーザは過去と現在の映像検索結果との間において類似している映像,および現在の検索において新規に得られた映像を明確に区別することができず,検索履歴に沿った一連の流れにおける映像検索結果の変化を確認することが困難だった.そこで本文では,動画像特徴量と検索履歴を元に3次元空間に映像を配置し,さらに群化の性質に基づいた可視化を行うことで,効果的な映像検索結果の可視化を検討する.
  • 映像の構造解析によるシーン分割の高精度化に関する検討 : PLSAにより得られる新たな特徴量を用いたアプローチ(感性とメディア及び一般)
    山本 誠, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年10月26日, 日本語
    本文では,映像から抽出される特徴量に内在する特性を統計的に解析し,その結果を用いることで高精度にシーン分割を行う手法を提案する.提案手法では,同一番組の映像のみで構成されるデータセットに対して,確率モデルに基づいてデータ中に内在する特性を解析する統計的手法Probabilistic Latent Semantic Analysis(PLSA)を適用し,それらの映像の特徴量に内在する特性を解析する.これにより得られる解析結果から新たな特徴量を算出することで,映像の特徴量を直接用いた場合に生じる精度の劣化を抑制したシーン分割が実現される.本文の最後では,実際にテレビで放映された映像に対して提案手法を適用し,その有効性を確認する.
  • 個人の嗜好を考慮した楽曲間の距離尺度とその類似楽曲検索への応用に関する考察(感性とメディア及び一般)
    小林 和也, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年10月26日, 日本語
    本文では,高精度な類似楽曲検索を実現するため,ユーザの嗜好を考慮した楽曲間の新たな距離尺度を提案する.提案手法では,メロディー,リズム,音色を表す特徴ベクトルを用いてマハラノビス距離の形式を持つ距離関数を定義し,その際用いられる行列をユーザの嗜好を表すパラメータとして学習する.このとき,提案手法は類似楽曲間の距離が他の楽曲間との距離と比較して小さな場合に低い値を示すコスト関数を設定し,これを最小化することで行列を求める.この行列をユーザ毎に変更することで,提案手法は各々のユーザに対して類似楽曲間の距離が小さくなる距離尺度が得られ,ユーザの望む類似楽曲を高精度に検索することが可能となる.
  • 画像検索のためのSVDDに基づく対象物の自動抽出に関する考察(コンシューマ,映像メディアおよび一般)
    岡田 周史, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年08月03日, 日本語
    本文では,画像検索のためのSVDDに基づく対象物の自動抽出手法を提案する.提案手法では,教師画像として与えられる対象物を含む画像および含まない画像にSVDDを適用することで,対象物が存在する領域を自動で抽出する.具体的に,SVDDにより算出される識別超球の中心からの距離に基づき,局所ブロックから得られる特徴ベクトルが対象クラスに属する確率を定義し,この確率の下,教師画像から対象物が存在する正例領域および存在しない負例領域の取得を可能とする.このとき,提案手法では,正例領域と負例領域をより高精度に分離することが可能な識別超球を与えるように,用いる特徴量を適応的に選択する.以上の超球の算出と正例領域および負例領域の抽出を,領域のサイズを変更して繰り返し行うことにより,あらかじめ教師画像から対象物を抽出することなく,画像中から対象物の検出が可能となるため,対象物に注目した画像検索が期待できる.
  • 音声認識を用いた高精度なシーン分割に関する一検討 : 撮像物体の対応付けによる動画像の構造解析の導入(コンシューマ,映像メディアおよび一般)
    成田 容, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年08月03日, 日本語
    本文では,音声認識結果に基づく新たな特徴量を定義し,その特徴量を用いてシーン分割の高精度化を行う手法を提案する.提案手法では,処理対象映像中の固定長の小区間において,音声認識結果から得られる単語の出現分布に基づき新たな特徴量を定義する.さらに,この特徴量を用いることで算出される区間同士の類似度を話題の類似度として定義する.この話題の類似度の時間変化から話題が切り替わるおよその時刻が検出されるため,その時刻に注目することで,既存のシーン分割手法との併用によりシーンカットの過剰検出を抑制することが可能となる.その結果,従来よりも映像の内容に基づいた高精度なシーン分割が実現される.
  • 映像のシーン検索のための可視化インタフェース(映像ハンドリング技術とその応用)
    長谷山 美紀
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 2009年05月21日, 日本語
    大量に蓄積された映像の視聴や検索を目的として行われた,映像処理技術と検索インタフェース実現に関する研究について紹介する.提案する検索インタフェースを用いることで,従来では困難であったユーザが明確なクエリを持ち合わせない場合においても,効果的に検索を行うことが可能となる.本文では,実際に実現されたインタフェースにより行われた検索結果を提示し,映像固有の多義性と曖昧性から,ユーザが効率的に望む映像に到達するために,検索結果を効果的に可視化するシステムの必要性について議論する.
  • 映像のシーン検索のための可視化インタフェース(映像ハンドリング技術とその応用)
    長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年05月21日, 日本語
    大量に蓄積された映像の視聴や検索を目的として行われた,映像処理技術と検索インタフェース実現に関する研究について紹介する.提案する検索インタフェースを用いることで,従来では困難であったユーザが明確なクエリを持ち合わせない場合においても,効果的に検索を行うことが可能となる.本文では,実際に実現されたインタフェースにより行われた検索結果を提示し,映像固有の多義性と曖昧性から,ユーザが効率的に望む映像に到達するために,検索結果を効果的に可視化するシステムの必要性について議論する.
  • 映像のシーン検索のための可視化インタフェース(映像ハンドリング技術とその応用)
    長谷山 美紀
    電子情報通信学会技術研究報告. MI, 医用画像, 2009年05月21日, 日本語
    大量に蓄積された映像の視聴や検索を目的として行われた,映像処理技術と検索インタフェース実現に関する研究について紹介する.提案する検索インタフェースを用いることで,従来では困難であったユーザが明確なクエリを持ち合わせない場合においても,効果的に検索を行うことが可能となる.本文では,実際に実現されたインタフェースにより行われた検索結果を提示し,映像固有の多義性と曖昧性から,ユーザが効率的に望む映像に到達するために,検索結果を効果的に可視化するシステムの必要性について議論する.
  • 3次元ウェーブレットによる誤り耐性動画像符号化法とエラーコンシールメント法に関する一考察(ITS画像処理,映像メディア及び一般)
    金 善美, 田中 宏和, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 英語
    無線伝送に適した3次元ウェーブレットによる誤り耐性動画像符号化法とそのエラーコンシールメント技術について検討する。本文において我々は、各動画像フレームを空間方向にウェーブレット変換したとき、近隣のウェーブレット係数は相関性が存在することに着目する。そこで、提案手法では係数を複数グループに分散的にグループ化した後、これらのグループ毎に時間方向のウェーブレット変換を行う新たな符号化法を導入する。さらに、受信側においてこれらのグループの複数が伝送路誤りによって欠落した際においても効率良く補間可能なエラーコンシールメント法を提案する。.本文の最後では、評価実験により提案方式の有効性を確認する。
  • サッカー映像における選手位置および撮像されたフィールド領域の推定に関する一考察(ITS画像処理,映像メディア及び一般)
    林 原局, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 日本語
    本稿では,2つのパーティクルフィルタを用いることで,サッカー映像から選手位置および撮像されたフィールド領域を高精度に推定する手法を提案する.提案手法では,サッカー映像における選手の位置を推定するパーティクルフィルタおよびサッカー映像を撮像しているカメラのパラメータを推定するパーティクルフィルタを定義する.このとき,各パーティクルフィルタにより得られる推定結果を互いの観測モデルへ導入し,それぞれ状態遷移を行うことにより選手位置およびフィールド領域の高精度な推定を可能とする.
  • 位相回復手法を用いた静止画像の高解像度化に関する一考察(ITS画像処理,映像メディア及び一般)
    平松 朋樹, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 日本語
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像の高解像度化手法を提案する.提案手法では,まず,低解像度画像における自己相関関数に対して相関値の補間処理を施すことで,高解像度画像における自己相関関数を推定する.このとき,Wiener-Khintchineの定理により,推定された高解像度画像の自己相関関数をフーリエ変換することで,高解像度画像におけるフーリエ振幅を得ることが可能となるため,これをERアルゴリズムにおけるフーリエ領域の拘束条件として導入する.さらに,低解像度画像から得られる周波数成分を高解像度画像における既知の低周波成分とし,これを画像領域における拘束条件として導入する.以上のようにして導出されるERアルゴリズムを用いてフーリエ位相の回復を行うことで,失われた高周波成分が自己相関関数の補間により生成され,低解像度画像のみから高解像度画像を得ることが可能となる.
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討(ITS画像処理,映像メディア及び一般)
    瀧澤 誠, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 日本語
    本文では,超解像処理を用いて,手ぶれにより劣化した動画像を復元・高解像度化する手法を提案する.提案手法では,動画像の各フレームに対し,手ぶれの劣化関数であるPSF(Point Spread Function)を推定し,得られるPSFを用いてフレーム間における対応を算出する.さらに,手ぶれ方向への平滑化を抑制する重み係数を新たに導入した超解像処理を適用することで,ぶれ方向への過剰な平滑化が抑制された高精度な復元および高解像度化を実現する.本文の最後では,比較実験を行い,提案手法の有効性を確認する.
  • SVDDに基づいた静止画像の適応的高解像度化に関する検討(ITS画像処理,映像メディア及び一般)
    小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 日本語
    本文では,Support Vector Data Description(SVDD)に基づいた静止画像の適応的高解像度化手法を提案する.提案手法ではまず,教師データとして与えられる高解像度の局所画像にSVDDを適用することで,識別超球の算出を行い,その中心との距離が最小となるように高解像度化の対象となる画像の未知の高周波成分を推定する.ここで,我々は画像の異なる階層間において局所画像が互いに類似する特徴に注目し,低解像度画像中の局所画像を教師データとして利用する.さらに,様々な種類のテクスチャを含む自然画像に対して高精度な高解像度化を可能とするため,提案手法では教師データとなる局所画像をあらかじめクラスタリングし,各クラスタについて得られる超球を用いて上記の未知の高周波成分の推定を行う.このとき,提案手法では各クラスタについて,推定される結果と超球の中心との距離に基づいて定義される確率の下,最終出力を決定する.その結果,テクスチャの種類に応じた未知の高周波成分の推定が可能となり,高精度な画像の高解像度化が期待できる.本文の最後では,提案手法の有効性を示すため,実画像を用いた比較実験を行い,その性能の評価を行う.
  • 映像の特徴に注目したWeb映像検索手法の高精度化 : 正準相関分析を用いたコミュニティ抽出に関する一検討(ITS画像処理,映像メディア及び一般)
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 日本語
    本文では,映像の特徴に注目した高精度なWeb映像検索手法を提案する.提案手法では,まず映像信号から得られる画像特徴及び音響特徴,映像を含むWebページのテキストから得られるテキスト特徴に対して正準相関分析を施すことで,新変量の空間における異なる特徴間での映像の類似度定義を可能とする.さらに,各映像の特徴をそれぞれ一つのWebページとみなし,得られる類似度に基づいた隣接行列の生成を行なう.その結果,提案手法では隣接行列にリンク解析を施すことで,類似した内容を含む映像の集合であるコミュニティの抽出が可能となり,映像の特徴に注目した効果的な映像検索が実現される.
  • パーティクルフィルタの拡張に関する検討 : 動画像のフロー推定への応用(ITS画像処理,映像メディア及び一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2009年02月04日, 日本語
    本文では,パーティクルフィルタを拡張し,ヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,互いに影響を与える2つの状態変数を含む状態遷移モデル,および一時刻前の観測が影響を与える観測モデルを用いる.これらのモデルを従来のパーティクルフィルタで用いる場合,従来法の仮定である,現時刻の状態変数の値が一時刻前の自身の値に従属すること,および現時刻の観測の値が現時刻の状態変数の値に従属することを満たさない.そのため,上述のモデルを満たす仮定を新たに用いることで,パーティクルフィルタを拡張する.さらに本文では,拡張したパーティクルフィルタをヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,2つの状態変数を順方向および逆方向のフローとして,それぞれの状態遷移モデルをフローの性質に基づいて定義する.また,勾配法および平行移動を表す成分に注目して拡張したヘルムホルツ分解定理のモデルを用いて,観測モデルおよび観測密度を定義する.これらの定義に基づくパーティクルフィルタでは,一時刻前の推定誤差の影響を受けない,輝度値の勾配,回転,発散,および平行移動に基づくフロー推定が可能である.その結果,高精度なフロー推定法が実現される.
  • 3次元ウェーブレットによる誤り耐性動画像符号化法とエラーコンシールメント法に関する一考察(符号化,ITS画像処理,映像メディア及び一般)
    金 善美, 田中 宏和, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 英語
    無線伝送に適した3次元ウェーブレットによる誤り耐性動画像符号化法とそのエラーコンシールメント技術について検討する。本文において我々は、各動画像フレームを空間方向にウェーブレット変換したとき、近隣のウェーブレット係数は相関性が存在することに着目する。そこで、提案手法では係数を複数グループに分散的にグループ化した後、これらのグループ毎に時間方向のウェーブレット変換を行う新たな符号化法を導入する。さらに、受信側においてこれらのグループの複数が伝送路誤りによって欠落した際においても効率良く補間可能なエラーコンシールメント法を提案する。本文の最後では、評価実験により提案方式の有効性を確認する。
  • 映像の特徴に注目したWeb映像検索手法の高精度化 : 正準相関分析を用いたコミュニティ抽出に関する一検討(映像システム,ITS画像処理,映像メディア及び一般)
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 日本語
    本文では,映像の特徴に注目した高精度なWeb映像検索手法を提案する.提案手法では,まず映像信号から得られる画像特徴及び音響特徴,映像を含むWebページのテキストから得られるテキスト特徴に対して正準相関分析を施すことで,新変量の空間における異なる特徴間での映像の類似度定義を可能とする.さらに,各映像の特徴をそれぞれ一つのWebページとみなし,得られる類似度に基づいた隣接行列の生成を行なう.その結果,提案手法では隣接行列にリンク解析を施すことで,類似した内容を含む映像の集合であるコミュニティの抽出が可能となり,映像の特徴に注目した効果的な映像検索が実現される.
  • パーティクルフィルタの拡張に関する検討 : 動画像のフロー推定への応用(画像処理,ITS画像処理,映像メディア及び一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 日本語
    本文では,パーティクルフィルタを拡張し,ヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,互いに影響を与える2つの状態変数を含む状態遷移モデル,および一時刻前の観測が影響を与える観測モデルを用いる.これらのモデルを従来のパーティクルフィルタで用いる場合,従来法の仮定である,現時刻の状態変数の値が一時刻前の自身の値に従属すること,および現時刻の観測の値が現時刻の状態変数の値に従属することを満たさない.そのため,上述のモデルを満たす仮定を新たに用いることで,パーティクルフィルタを拡張する.さらに本文では,拡張したパーティクルフィルタをヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,2つの状態変数を順方向および逆方向のフローとして,それぞれの状態遷移モデルをフローの性質に基づいて定義する.また,勾配法および平行移動を表す成分に注目して拡張したヘルムホルツ分解定理のモデルを用いて,観測モデルおよび観測密度を定義する.これらの定義に基づくパーティクルフィルタでは,一時刻前の推定誤差の影響を受けない,輝度値の勾配,回転,発散,および平行移動に基づくフロー推定が可能である.その結果,高精度なフロー推定法が実現される.
  • サッカー映像における選手位置および撮像されたフィールド領域の推定に関する一考察(領域抽出,ITS画像処理,映像メディア及び一般)
    林 原局, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 日本語
    本稿では,2つのパーティクルフィルタを用いることで,サッカー映像から選手位置および撮像されたフィールド領域を高精度に推定する手法を提案する.提案手法では,サッカー映像における選手の位置を推定するパーティクルフィルタおよびサッカー映像を撮像しているカメラのパラメータを推定するパーティクルフィルタを定義する.このとき,各パーティクルフィルタにより得られる推定結果を互いの観測モデルへ導入し,それぞれ状態遷移を行うことにより選手位置およびフィールド領域の高精度な推定を可能とする.
  • 位相回復手法を用いた静止画像の高解像度化に関する一考察(画質改善,ITS画像処理,映像メディア及び一般)
    平松 朋樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 日本語
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像の高解像度化手法を提案する.提案手法では,まず,低解像度画像における自己相関関数に対して相関値の補間処理を施すことで,高解像度画像における自己相関関数を推定する.このとき,Wiener-Khintchineの定理により,推定された高解像度画像の自己相関関数をフーリエ変換することで,高解像度画像におけるフーリエ振幅を得ることが可能となるため,これをERアルゴリズムにおけるフーリエ領域の拘束条件として導入する.さらに,低解像度画像から得られる周波数成分を高解像度画像における既知の低周波成分とし,これを画像領域における拘束条件として導入する.以上のようにして導出されるERアルゴリズムを用いてフーリエ位相の回復を行うことで,失われた高周波成分が自己相関関数の補間により生成され,低解像度画像のみから高解像度画像を得ることが可能となる.
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討(画質改善,ITS画像処理,映像メディア及び一般)
    瀧澤 誠, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 日本語
    本文では,超解像処理を用いて,手ぶれにより劣化した動画像を復元・高解像度化する手法を提案する.提案手法では,動画像の各フレームに対し,手ぶれの劣化関数であるPSF(Point Spread Function)を推定し,得られるPSFを用いてフレーム間における対応を算出する.さらに,手ぶれ方向への平滑化を抑制する重み係数を新たに導入した超解像処理を適用することで,ぶれ方向への過剰な平滑化が抑制された高精度な復元および高解像度化を実現する.本文の最後では,比較実験を行い,提案手法の有効性を確認する.
  • SVDDに基づいた静止画像の適応的高解像度化に関する検討(画質改善,ITS画像処理,映像メディア及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2009年01月28日, 日本語
    本文では,Support Vector Data Description(SVDD)に基づいた静止画像の適応的高解像度化手法を提案する.提案手法ではまず,教師データとして与えられる高解像度の局所画像にSVDDを適用することで,識別超球の算出を行い,その中心との距離が最小となるように高解像度化の対象となる画像の未知の高周波成分を推定する.ここで,我々は画像の異なる階層間において局所画像が互いに類似する特徴に注目し,低解像度画像中の局所画像を教師データとして利用する.さらに,様々な種類のテクスチャを含む自然画像に対して高精度な高解像度化を可能とするため,提案手法では教師データとなる局所画像をあらかじめクラスタリングし,各クラスタについて得られる超球を用いて上記の未知の高周波成分の推定を行う.このとき,提案手法では各クラスタについて,推定される結果と超球の中心との距離に基づいて定義される確率の下,最終出力を決定する.その結果,テクスチャの種類に応じた未知の高周波成分の推定が可能となり,高精度な画像の高解像度化が期待できる.本文の最後では,提案手法の有効性を示すため,実画像を用いた比較実験を行い,その性能の評価を行う.
  • 3次元ウェーブレットによる誤り耐性動画像符号化法とエラーコンシールメント法に関する一考察(符号化,ITS画像処理,映像メディア及び一般)
    金 善美, 田中 宏和, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 英語
    無線伝送に適した3次元ウェーブレットによる誤り耐性動画像符号化法とそのエラーコンシールメント技術について検討する。本文において我々は、各動画像フレームを空間方向にウェーブレット変換したとき、近隣のウェーブレット係数は相関性が存在することに着目する。そこで、提案手法では係数を複数グループに分散的にグループ化した後、これらのグループ毎に時間方向のウェーブレット変換を行う新たな符号化法を導入する。さらに、受信側においてこれらのグループの複数が伝送路誤りによって欠落した際においても効率良く補間可能なエラーコンシールメント法を提案する。本文の最後では、評価実験により提案方式の有効性を確認する。
  • 映像の特徴に注目したWeb映像検索手法の高精度化 : 正準相関分析を用いたコミュニティ抽出に関する一検討(映像システム,ITS画像処理,映像メディア及び一般)
    畠山 泰貴, 小川 貴弘, 浅水 仁, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 日本語
    本文では,映像の特徴に注目した高精度なWeb映像検索手法を提案する.提案手法では,まず映像信号から得られる画像特徴及び音響特徴,映像を含むWebページのテキストから得られるテキスト特徴に対して正準相関分析を施すことで,新変量の空間における異なる特徴間での映像の類似度定義を可能とする.さらに,各映像の特徴をそれぞれ一つのWebページとみなし,得られる類似度に基づいた隣接行列の生成を行なう.その結果,提案手法では隣接行列にリンク解析を施すことで,類似した内容を含む映像の集合であるコミュニティの抽出が可能となり,映像の特徴に注目した効果的な映像検索が実現される.
  • パーティクルフィルタの拡張に関する検討 : 動画像のフロー推定への応用(画像処理,ITS画像処理,映像メディア及び一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 日本語
    本文では,パーティクルフィルタを拡張し,ヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,互いに影響を与える2つの状態変数を含む状態遷移モデル,および一時刻前の観測が影響を与える観測モデルを用いる.これらのモデルを従来のパーティクルフィルタで用いる場合,従来法の仮定である,現時刻の状態変数の値が一時刻前の自身の値に従属すること,および現時刻の観測の値が現時刻の状態変数の値に従属することを満たさない.そのため,上述のモデルを満たす仮定を新たに用いることで,パーティクルフィルタを拡張する.さらに本文では,拡張したパーティクルフィルタをヘルムホルツ分解定理に基づくフロー推定法に応用する.提案手法では,2つの状態変数を順方向および逆方向のフローとして,それぞれの状態遷移モデルをフローの性質に基づいて定義する.また,勾配法および平行移動を表す成分に注目して拡張したヘルムホルツ分解定理のモデルを用いて,観測モデルおよび観測密度を定義する.これらの定義に基づくパーティクルフィルタでは,一時刻前の推定誤差の影響を受けない,輝度値の勾配,回転,発散,および平行移動に基づくフロー推定が可能である.その結果,高精度なフロー推定法が実現される.
  • サッカー映像における選手位置および撮像されたフィールド領域の推定に関する一考察(領域抽出,ITS画像処理,映像メディア及び一般)
    林 原局, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 日本語
    本稿では,2つのパーティクルフィルタを用いることで,サッカー映像から選手位置および撮像されたフィールド領域を高精度に推定する手法を提案する.提案手法では,サッカー映像における選手の位置を推定するパーティクルフィルタおよびサッカー映像を撮像しているカメラのパラメータを推定するパーティクルフィルタを定義する.このとき,各パーティクルフィルタにより得られる推定結果を互いの観測モデルへ導入し,それぞれ状態遷移を行うことにより選手位置およびフィールド領域の高精度な推定を可能とする.
  • 位相回復手法を用いた静止画像の高解像度化に関する一考察(画質改善,ITS画像処理,映像メディア及び一般)
    平松 朋樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 日本語
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像の高解像度化手法を提案する.提案手法では,まず,低解像度画像における自己相関関数に対して相関値の補間処理を施すことで,高解像度画像における自己相関関数を推定する.このとき,Wiener-Khintchineの定理により,推定された高解像度画像の自己相関関数をフーリエ変換することで,高解像度画像におけるフーリエ振幅を得ることが可能となるため,これをERアルゴリズムにおけるフーリエ領域の拘束条件として導入する.さらに,低解像度画像から得られる周波数成分を高解像度画像における既知の低周波成分とし,これを画像領域における拘束条件として導入する.以上のようにして導出されるERアルゴリズムを用いてフーリエ位相の回復を行うことで,失われた高周波成分が自己相関関数の補間により生成され,低解像度画像のみから高解像度画像を得ることが可能となる.
  • 手ぶれにより劣化した動画像の復元および高解像度化に関する一検討(画質改善,ITS画像処理,映像メディア及び一般)
    瀧澤 誠, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 日本語
    本文では,超解像処理を用いて,手ぶれにより劣化した動画像を復元・高解像度化する手法を提案する.提案手法では,動画像の各フレームに対し,手ぶれの劣化関数であるPSF(Point Spread Function)を推定し,得られるPSFを用いてフレーム間における対応を算出する.さらに,手ぶれ方向への平滑化を抑制する重み係数を新たに導入した超解像処理を適用することで,ぶれ方向への過剰な平滑化が抑制された高精度な復元および高解像度化を実現する.本文の最後では,比較実験を行い,提案手法の有効性を確認する.
  • SVDDに基づいた静止画像の適応的高解像度化に関する検討(画質改善,ITS画像処理,映像メディア及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2009年01月28日, 日本語
    本文では,Support Vector Data Description(SVDD)に基づいた静止画像の適応的高解像度化手法を提案する.提案手法ではまず,教師データとして与えられる高解像度の局所画像にSVDDを適用することで,識別超球の算出を行い,その中心との距離が最小となるように高解像度化の対象となる画像の未知の高周波成分を推定する.ここで,我々は画像の異なる階層間において局所画像が互いに類似する特徴に注目し,低解像度画像中の局所画像を教師データとして利用する.さらに,様々な種類のテクスチャを含む自然画像に対して高精度な高解像度化を可能とするため,提案手法では教師データとなる局所画像をあらかじめクラスタリングし,各クラスタについて得られる超球を用いて上記の未知の高周波成分の推定を行う.このとき,提案手法では各クラスタについて,推定される結果と超球の中心との距離に基づいて定義される確率の下,最終出力を決定する.その結果,テクスチャの種類に応じた未知の高周波成分の推定が可能となり,高精度な画像の高解像度化が期待できる.本文の最後では,提案手法の有効性を示すため,実画像を用いた比較実験を行い,その性能の評価を行う.
  • 超解像処理に基づく動画像の高解像度化および高フレームレート化に関する一検討 : 特徴点の対応に注目したクラスタリングの導入(感性とメディア及び一般)
    瀧澤 誠, 長谷山 美紀
    映像情報メディア学会技術報告, 2008年10月23日, 日本語
    本文では,超解像処理を用いて動画像の高解像度化および高フレームレート化を行う手法を提案する.提案手法では,フレーム間における画素の対応を,複数の特徴点の対応に基づき得られる射影変換のパラメータで表す.このとき,特徴点の対応をクラスタリングし,最大のクラスタを構成する特徴点の対応から射影変換のパラメータを求めることで,動物体が複数存在する場合にも高精度なカメラパラメータの推定を実現する.その結果,連続する既知のフレームとそれらの間に存在する未知のフレームとの画素の対応を推定し,さらに超解像処理を適用することで,動画像の高精細な高解像度化および高フレームレート化か可能となる.本文の最後では,比較実験を行い,提案手法の有効性を確認する.
  • リンク解析に基づくWebページ中に存在する画像の類似度算出に関する検討(感性とメディア及び一般)
    村山 聖太, 長谷山 美紀
    映像情報メディア学会技術報告, 2008年10月23日, 日本語
    本文では,リンク解析に基づくWebページ中に存在する画像の類似度算出法を提案する.我々は,共通の内容を含むWebページの集合において,リンク関係の存在するWebページ中の画像には共通の内容を含む領域が存在し,かつそれらの領域における画像特徴は類似していると仮定する.この仮定に基づき,提案手法では共通の内容を含む領域の画像特微量に注目した類似度を新たに定義する.新たに定義した類似度を用いることで,画像に異なる内容を含む領域が存在する場合に適切な類似度算出が困難である従来の問題が解決され,高精度な画像検索の実現が期待できる.
  • パーティクルフィルタによるフローの推定に関する検討 : 観測モデルへのヘルムホルツ分解定理の導入(感性とメディア及び一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2008年10月23日, 日本語
    本文では,ヘルムホルツ分解定理に着眼したパーティクルフィルタによるフロー推定法を提案する.ヘルムホルツ分解定理を用いた従来法では,平行移動および過去に推定されたフローの推定誤差を考慮していないため,その推定性能が低下する場合が存在する.そこで提案手法では,平行移動に注目して,ヘルムホルツ分解定理のモデルを拡張する.これにより,平行移動を考慮したフローの推定が可能となり,その推定性能の向上が期待できる.さらに提案手法では,パーティクルフィルタの状態変数をフローとし,一時刻前のフレームの各画素におけるフローが現時刻のフレームの各画素におけるフローへ推移する過程を状態遷移モデルで定義する.また,以下に示す2つの過程を観測モデルとして定義する.1つ目は,現時刻のフレーム中の各画素におけるフローからそのフレーム中の各画素における輝度値が生成され,雑音が重畳する過程である.2つ目は,現時刻のフレーム中の各画素におけるフローがヘルムホルツ分解定理により回転成分および発散成分に分解され,雑音が重畳する過程である.それらのモデルに基づくパーティクルフィルタを用いることで,提案手法では一時刻前のフレーム中の各画素におけるフローの推定誤差の影響を受けずに現時刻のフレーム中の各画素におけるフローを推定することが可能となる.
  • 幾何モデルに基づく映像からの人数推定(マルチメディア情報入力及び処理方式および一般)
    新井 啓之, 宮川 勲, 小池 秀樹, 長谷山 美紀
    映像情報メディア学会技術報告, 2008年06月23日, 日本語
    デジタルサイネージの広告効果測定への適用を想定した,混雑時にも適用可能でかつ簡易な初期設定で利用可能な映像からの人数推定方法を提案する.本手法では,各画素が実空間の人物表面上でどのくらいの面積を占めるかを考慮することにより,画素から人数への変換係数を定義する.そして入力画像において検出された前景画素に沿ってこの変換係数を積算することにより推定人数を得る.局所的な処理結果の単純な積算として人数を推定できるため,混雑時においても安定な処理が可能となる.また処理に必要な幾何パラメータは,人の平均身長など先験的知識から決定されるものとカメラ校正により取得できるもののみであり,カメラ校正を行っておけばカメラ毎の細かなチューニングは不要となる.実画像を用いた実験により本手法の妥当性を確認した.
  • MC-CDMAにおける周波数方向誤り訂正符号化法に関する一検討(スマートパーソナルシステム,一般)
    田中 宏和, 蒋 慶雲, 山崎 彰一郎, 長谷山 美紀
    電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム, 2008年06月05日, 日本語
    CDMAとOFDMを組み合わせたMulti-carrier(MC)CDMAシステムは移動通信環境における高速伝送に効果的なシステムである。一方でハードウェアによる実現を考えると、ハイパワーアンプ(HPA)の非線形特性によって生じる帯域外輻射やPAPRの影響を出来るだけ少なくするため、HPAの特性は通常高い線形性が要求される。これらの問題を解決する手段の1つとしてbi-orthogonal変調を用いる方式が提案されている。 bi-orthogonal変調を適用したMC-CDMAの誤りを考えた場合、受信機におけるsign bit復調誤りよりもHadamard符号語の符号選択誤りの方が影響が大きいという特徴がある。本論文では、周波数方向にReed-Solomon(RS)符号化を行うことで、効率よく符号選択誤りを低減する方式を提案する。更に受信機側でRS復号結果を相関復調装置にフィードバックすることで、sign bitのビット誤り率も合わせて低減できることを示す。そして、これら提案方式について理論解析とシミュレーションによる特性評価を行う。
  • MC-CDMAにおける周波数方向誤り訂正符号化法に関する一検討
    田中 宏和, 蒋 慶雲, 山崎 彰一郎, 長谷山 美紀
    電子情報通信学会技術研究報告. SIS, スマートインフォメディアシステム, 2008年06月05日, 日本語
  • 色成分に着眼したレベルセット法を用いたサッカー映像における選手追跡に関する一検討(ITS画像処理,映像メディア及び一般)
    林 原局, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月12日, 日本語
    本稿では,レベルセット法を用いてサッカー映像中の選手を高精度に追跡する手法を提案する.提案手法では、レベルセット法における評価関数に,境界面が滑らかさを保つための特徴量に加え,選手のユニフォームの色成分に着眼した新たな特徴量を導入する.これにより提案手法では,異なるチームを区別した高精度な選手の追跡が可能となる.
  • 複数の検出器に基づく人物検出の高精度化に関する考察(ITS画像処理,映像メディア及び一般)
    加賀 陽介, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月12日, 日本語
    本文では,複数の検出器を用いることで動画像から高精度に人物を検出する手法を提案する.提案手法では,歩行者検出と顔検出の2種類の検出結果を2次元平面上へ投票し,最終的な人物検出結果を得る.これにより,種類の異なる検出結果が一つに統合され,単一の検出器では検出が困難となる場合でも高精度な人物検出が実現可能となる.本文の最後では提案手法を実画像に適用する実験を行い,その有効性を確認する.
  • マクロブロックの特徴を用いたクラスタリングに基づく適応内挿フィルタの設計に関する検討(ITS画像処理,映像メディア及び一般)
    松野 孝也, 近藤 敏志, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月12日, 日本語
    本文では,マクロブロックの特徴に着目したクラスタリングに基づく適応内挿フィルタ設計手法を提案する.提案手法では,マクロブロックについてそれらの動きベクトルに着目し,内挿フィルタにより補間される小数位置に基づいたクラスタリングを行う.さらに各クラスタごとに整数位置画素から小数位置画素を補間する内挿フィルタを最小二乗規範に基づき設計する.補間される位置に着目してクラスタリングを行い得られるクラスタごとに内挿フィルタを設計することで,得られるフィルタはフレーム内の水平方向と垂直方向における自己相関の差異を考慮することが可能となる.その結果,内挿フィルタを用いることで動き補償予測誤差を低減することが可能となり,符号化効率の向上が実現される.
  • モーフィングに基づくフレーム補間に関する一検討 : 適応的な対応点推定における領域分割の高精度化(ITS画像処理,映像メディア及び一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月12日, 日本語
    本稿では,適応的な対応点推定に基づくモーフィングを用いたフレーム補間法を提案する.提案手法では,フレーム補間を行う処理対象の2フレーム間において,エッジなどの特徴を対応付ける点を推定し,その対応点に基づいてモーフィングを行うことにより,補間フレームを生成する.対応点を推定する際には,処理対象フレームを動物体領域と背景領域に分割し,それぞれの領域に適した手法を用いることで,高精度な対応点の推定を可能とする.このとき,提案手法では領域分割処理において,一時刻前の補間フレームとその領域分割結果を用いて検証を行うことで,高精度な背景領域と動物体領域の推定を可能とする.さらに,提案手法では得られた対応点を用いて補間フレームを生成する際に,動物体領域と背景領域を異なる処理により補間することで,動物体と背景の境界付近において高精度な補間を行うことを可能とする.
  • カルマンフィルタを用いたエラーコンシールメントに関する一検討 : 動画像の復号過程を表現した状態遷移モデルの実現(ITS画像処理,映像メディア及び一般)
    高橋 茂樹, 小川 貴弘, 田中 宏和, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月12日, 日本語
    本文では,カルマンフィルタを用いた動画像の高精度なエラーコンシールメント手法を提案する.提案手法では,カルマンフィルタの状態変数を動画像の各フレームにおける輝度値とみなし,以下の状態遷移モデルと観測モデルを設計することでエラーコンシールメントを実現する.まず,動きベクトルを用いることで,動画像の復号過程を表す状態遷移モデルを設計する.さらに,新たな劣化過程を導入した観測モデルを設計することで,カルマンゲインの算出を可能とし,状態遷移による推定値の補正を実現する.このように,新たな状態遷移モデルと観測モデルを導入することで,提案手法では最小二乗規範に基づいてカルマンフィルタによるエラーコンシールメントを行うことが可能となる.本文の最後では,実際にエラーを与えた動画像に対して提案手法を適用し,その有効性を確認する.
  • 色成分に着眼したレベルセット法を用いたサッカー映像における選手追跡に関する一検討(ITS画像処理,映像メディア及び一般)
    林 原局, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月12日, 日本語
    本稿では,レベルセット法を用いてサッカー映像中の選手を高精度に追跡する手法を提案する.提案手法では、レベルセット法における評価関数に,境界面が滑らかさを保つための特徴量に加え,選手のユニフォームの色成分に着眼した新たな特徴量を導入する.これにより提案手法では,異なるチームを区別した高精度な選手の追跡が可能となる.
  • 複数の検出器に基づく人物検出の高精度化に関する考察(ITS画像処理,映像メディア及び一般)
    加賀 陽介, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月12日, 日本語
    本文では,複数の検出器を用いることで動画像から高精度に人物を検出する手法を提案する.提案手法では,歩行者検出と顔検出の2種類の検出結果を2次元平面上へ投票し,最終的な人物検出結果を得る.これにより,種類の異なる検出結果が一つに統合され,単一の検出器では検出が困難となる場合でも高精度な人物検出が実現可能となる.本文の最後では提案手法を実画像に適用する実験を行い,その有効性を確認する.
  • マクロブロックの特徴を用いたクラスタリングに基づく適応内挿フィルタの設計に関する検討(ITS画像処理,映像メディア及び一般)
    松野 孝也, 近藤 敏志, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月12日, 日本語
    本文では,マクロブロックの特徴に着目したクラスタリングに基づく適応内挿フィルタ設計手法を提案する.提案手法では,マクロブロックについてそれらの動きベクトルに着目し,内挿フィルタにより補間される小数位置に基づいたクラスタリングを行う.さらに各クラスタごとに整数位置画素から小数位置画素を補間する内挿フィルタを最小二乗規範に基づき設計する.補間される位置に着目してクラスタリングを行い得られるクラスタごとに内挿フィルタを設計することで,得られるフィルタはフレーム内の水平方向と垂直方向における自己相関の差異を考慮することが可能となる.その結果,内挿フィルタを用いることで動き補償予測誤差を低減することが可能となり,符号化効率の向上が実現される.
  • モーフィングに基づくフレーム補間に関する一検討 : 適応的な対応点推定における領域分割の高精度化(ITS画像処理,映像メディア及び一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月12日, 日本語
    本稿では,適応的な対応点推定に基づくモーフィングを用いたフレーム補間法を提案する.提案手法では,フレーム補間を行う処理対象の2フレーム間において,エッジなどの特徴を対応付ける点を推定し,その対応点に基づいてモーフィングを行うことにより,補間フレームを生成する.対応点を推定する際には,処理対象フレームを動物体領域と背景領域に分割し,それぞれの領域に適した手法を用いることで,高精度な対応点の推定を可能とする.このとき,提案手法では領域分割処理において,一時刻前の補間フレームとその領域分割結果を用いて検証を行うことで,高精度な背景領域と動物体領域の推定を可能とする.さらに,提案手法では得られた対応点を用いて補間フレームを生成する際に,動物体領域と背景領域を異なる処理により補間することで,動物体と背景の境界付近において高精度な補間を行うことを可能とする.
  • カルマンフィルタを用いたエラーコンシールメントに関する一検討 : 動画像の復号過程を表現した状態遷移モデルの実現(ITS画像処理,映像メディア及び一般)
    高橋 茂樹, 小川 貴弘, 田中 宏和, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月12日, 日本語
    本文では,カルマンフィルタを用いた動画像の高精度なエラーコンシールメント手法を提案する.提案手法では,カルマンフィルタの状態変数を動画像の各フレームにおける輝度値とみなし,以下の状態遷移モデルと観測モデルを設計することでエラーコンシールメントを実現する.まず,動きベクトルを用いることで,動画像の復号過程を表す状態遷移モデルを設計する.さらに,新たな劣化過程を導入した観測モデルを設計することで,カルマンゲインの算出を可能とし,状態遷移による推定値の補正を実現する.このように,新たな状態遷移モデルと観測モデルを導入することで,提案手法では最小二乗規範に基づいてカルマンフィルタによるエラーコンシールメントを行うことが可能となる.本文の最後では,実際にエラーを与えた動画像に対して提案手法を適用し,その有効性を確認する.
  • カーネル主成分分析を用いた画像の意味的特徴量の推定法に関する考察 : 画像内容に基づいた類似画像検索のための一検討(ITS画像処理,映像メディア及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月11日, 日本語
    本文では,画像内容に基づく類似画像検索を実現するため,カーネル主成分分析を用いた画像の意味的特徴量の推定手法を提案する.提案手法では,あらかじめキーワードが付与されているデータベース中の画像をクラスタリングし,各クラスタから得られる画像特徴量および意味的特徴量の非線形固有空間を用いて,新たな写像を導出する.このとき得られる写像は,同一のクラスタに属する画像に対して,その画像特徴量から意味的特徴量を高精度に推定する.そこで,提案手法ではキーワードが未知のクエリ画像に対して,その意味的特徴量を推定する際に画像特徴量で生じる誤差に注目することで,属するクラスタの適応的選択を行う.これにより,クエリ画像の意味的特徴量は最適なクラスタによって精度良く推定されるため,その結果から画像内容に基づいた類似画像検索を行うことが可能となる.
  • 映像の構造に基づいたシーン分割に関する一検討 : 動画像信号と音響信号の協調利用によるアプローチ(ITS画像処理,映像メディア及び一般)
    山本 誠, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月11日, 日本語
    本文では,動画像信号と音響信号の両者の繰り返し構造に基づき,映像信号のシーン分割を行う手法を提案する.提案手法では,映像信号のショットに対して,動画像信号と音響信号から得られる特徴量を用いてクラスタリングを行い,類似したショットの繰り返し構造をそれぞれ取得する.具体的に,これらの構造は,類似したショットを含むクラスタをノード,ショットの時間推移を辺とすることにより有向グラフで表現される.したがって,作成された二つの有向グラフの両者に対して,共通するカット辺を求めることで,二つの信号を有効に用いた映像信号のシーン分割が可能となる.その結果,提案手法は従来の動画像信号のみを用いたシーン分割法において発生するシーンの過分割の抑制を実現した.
  • 映像検索のための画像及び音響信号によるシーン間の相違度定義に関する検討(ITS画像処理,映像メディア及び一般)
    道山 大悟, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月11日, 日本語
    本稿では,映像検索のための画像及び音響信号に基づくシーン間の相違度定義を行う手法を提案する.提案手法では,シーン間の任意の2ショットにおいて,画像特徴量,音響特徴量,及びそれらを統合して得られた特徴量を比較し,最も類似した特徴量に対しDynamic Time Warpingを施すことによりシーン間の相違度を算出する.この際,正準相関分析を用いて得られる写像により画像特徴量と音響特徴量を同一の特徴空間にて表し,この特徴空間にて特徴量の比較を行う.新たな特徴空間は,映像から得られる画像特徴量と音響特徴量の相関が最大となるような写像を用いて定義されるため,画像信号と音響信号に含まれる共通の特徴に着目した比較が可能となる.これにより,提案手法ではシーン間で類似した特徴量を適切に選択することで,高精度なシーン間の相違度算出を実現する.本稿の最後では,提案手法により得られる相違度を用いてシーン検索の実験を行うことで,その有効性を評価する.
  • メロディーに着眼した類似度に基づく類似楽曲抽出の精度に関する一考察(ITS画像処理,映像メディア及び一般)
    小林 和也, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2008年02月11日, 日本語
    本文では,我々が以前に提案した楽曲間の相違度算出手法を楽曲データベースに適用し,類似楽曲抽出を行うことでその有効性の評価を行う.この手法では,楽曲のメロディーの推移に着眼した特徴量を算出し,得られる特徴量に対してDynamic Time Warpingを適用することで楽曲間の相違度の算出を可能とした.ただし,以前我々が精度評価のために行った実験では,数曲の楽曲を用いた相違度算出に留まっており,類似楽曲抽出の十分な検証を行っていなかった.そこで,本文では284曲で構成される楽曲データベースを用いて評価実験を行い,類似楽曲抽出の精度について考察する.さらに,他手法との比較を行い,本手法の有効性について検討を行う.
  • カーネル主成分分析を用いた画像の意味的特徴量の推定法に関する考察 : 画像内容に基づいた類似画像検索のための一検討(ITS画像処理,映像メディア及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月11日, 日本語
    本文では,画像内容に基づく類似画像検索を実現するため,カーネル主成分分析を用いた画像の意味的特徴量の推定手法を提案する.提案手法では,あらかじめキーワードが付与されているデータベース中の画像をクラスタリングし,各クラスタから得られる画像特徴量および意味的特徴量の非線形固有空間を用いて,新たな写像を導出する.このとき得られる写像は,同一のクラスタに属する画像に対して,その画像特徴量から意味的特徴量を高精度に推定する.そこで,提案手法ではキーワードが未知のクエリ画像に対して,その意味的特徴量を推定する際に画像特徴量で生じる誤差に注目することで,属するクラスタの適応的選択を行う.これにより,クエリ画像の意味的特徴量は最適なクラスタによって精度良く推定されるため,その結果から画像内容に基づいた類似画像検索を行うことが可能となる.
  • 映像の構造に基づいたシーン分割に関する一検討 : 動画像信号と音響信号の協調利用によるアプローチ(ITS画像処理,映像メディア及び一般)
    山本 誠, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月11日, 日本語
    本文では,動画像信号と音響信号の両者の繰り返し構造に基づき,映像信号のシーン分割を行う手法を提案する.提案手法では,映像信号のショットに対して,動画像信号と音響信号から得られる特徴量を用いてクラスタリングを行い,類似したショットの繰り返し構造をそれぞれ取得する.具体的に,これらの構造は,類似したショットを含むクラスタをノード,ショットの時間推移を辺とすることにより有向グラフで表現される.したがって,作成された二つの有向グラフの両者に対して,共通するカット辺を求めることで,二つの信号を有効に用いた映像信号のシーン分割が可能となる.その結果,提案手法は従来の動画像信号のみを用いたシーン分割法において発生するシーンの過分割の抑制を実現した.
  • 映像検索のための画像及び音響信号によるシーン間の相違度定義に関する検討(ITS画像処理,映像メディア及び一般)
    道山 大悟, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月11日, 日本語
    本稿では,映像検索のための画像及び音響信号に基づくシーン間の相違度定義を行う手法を提案する.提案手法では,シーン間の任意の2ショットにおいて,画像特徴量,音響特徴量,及びそれらを統合して得られた特徴量を比較し,最も類似した特徴量に対しDynamic Time Warpingを施すことによりシーン間の相違度を算出する.この際,正準相関分析を用いて得られる写像により画像特徴量と音響特徴量を同一の特徴空間にて表し,この特徴空間にて特徴量の比較を行う.新たな特徴空間は,映像から得られる画像特徴量と音響特徴量の相関が最大となるような写像を用いて定義されるため,画像信号と音響信号に含まれる共通の特徴に着目した比較が可能となる.これにより,提案手法ではシーン間で類似した特徴量を適切に選択することで,高精度なシーン間の相違度算出を実現する.本稿の最後では,提案手法により得られる相違度を用いてシーン検索の実験を行うことで,その有効性を評価する.
  • メロディーに着眼した類似度に基づく類似楽曲抽出の精度に関する一考察(ITS画像処理,映像メディア及び一般)
    小林 和也, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2008年02月11日, 日本語
    本文では,我々が以前に提案した楽曲間の相違度算出手法を楽曲データベースに適用し,類似楽曲抽出を行うことでその有効性の評価を行う.この手法では,楽曲のメロディーの推移に着眼した特徴量を算出し,得られる特徴量に対してDynamic Time Warpingを適用することで楽曲間の相違度の算出を可能とした.ただし,以前我々が精度評価のために行った実験では,数曲の楽曲を用いた相違度算出に留まっており,類似楽曲抽出の十分な検証を行っていなかった.そこで,本文では284曲で構成される楽曲データベースを用いて評価実験を行い,類似楽曲抽出の精度について考察する.さらに,他手法との比較を行い,本手法の有効性について検討を行う.
  • 携帯電話を用いた救急救命のための情報提供システム
    小川 貴弘, 佐久間 大輔, 白石 真一, 長谷山 美紀
    映像情報メディア学会誌 : 映像情報メディア, 2007年12月01日, 日本語
    We propose the use of a system that provides information about emergency rescue procedures for mobile phone users. To enable the users to easily understand the procedures, avatars demonstrate how they are used. Since the avatars are efficiently constructed on a subset of scalable vector graphics (SVG), they can be quickly transmitted to the mobile phone and with low computational loads. In addition to the avatars, complementary voice and text data that explain the procedures are also transmitted via a synchronized multimedia integration language (SMIL, pronounced "smile") format. Moreover, to verify the performance and the effectiveness of the proposed system, we implemented a dedicated SMIL player suitable for use with mobile phones.
  • 位相と分布推定の利用による2次元2値点分布の3次識別系の改良(パターン認識・メディア理解及び一般)
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 2007年11月22日, 日本語
    移動,回転,拡縮パターンの識別に,観測面の画素3個で表される三角形の相似関係を用いる3次系は有用である.しかし,類似するパターンで,相対的な位置が同じ三角形に,相似でないものがある.そのため,識別率の改善に,識別されるクラスが既知である学習パターンが多数必要であった.本論文で提案する2次元2値点分布の識別系では,まず,学習パターンから,その類似パターンにも共通する特徴を表す類似パターンを生成し,これも学習パターンにする.次に,学習パターンを,統計的に推測されるその類似パターンも表す特徴ベクトルに変換する.特徴ベクトルは,2点の相対的な距離や位置向きを表す.さらに,その特徴ベクトルから,その統計的な特徴を表す特徴ベクトルも生成する.学習パターンが3個与えられると,文字や混合分布の識別率は飽和することを確認する.
  • クラスタリング手法Dynamic Coalescence Modelの離散化による相対的に不変である位置におけるクラスタの代表点の発見(パターン認識・メディア理解及び一般)
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾
    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解, 2007年11月22日, 日本語
    本論文では,クラスタリング手法Dynamic Coalescence Model (DCM)で発見されるクラスタの代表点を,相対的に不変である位置に発見する手法を提案する. DCMでは,点が球で表され,場の概念に基づいて,球を動かして接触した球を凝縮することが繰り返される.凝縮後の球はクラスタの代表点を表す.しかし,球の位置や移動変位は連続値で表される.そのため,球が凝縮される位置を越えて動かされる場合があった.その上,球の移動距離は,他の球から受ける引力の総和の大きさに比例する値である.そのため,単峰であるクラスタの代表点が,その重心から遠い位置に発見される場合が多かった.提案手法では,点が質点で表され,その位置が離散値で表され,質点の移動変位はその加速度を量子化したベクトルで表される.点分布から,その特徴を表し,相対的な位置が不変である,代表点の分布が生成される.本論文では,提案手法の射影や領域分割,文字認識などへの応用の可能性も示す.
  • 位相と分布推定の利用による2次元2値点分布の3次識別系の改良(パターン認識・メディア理解及び一般)
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾
    電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 2007年11月22日, 日本語
    移動,回転,拡縮パターンの識別に,観測面の画素3個で表される三角形の相似関係を用いる3次系は有用である.しかし,類似するパターンで,相対的な位置が同じ三角形に,相似でないものがある.そのため,識別率の改善に,識別されるクラスが既知である学習パターンが多数必要であった.本論文で提案する2次元2値点分布の識別系では,まず,学習パターンから,その類似パターンにも共通する特徴を表す類似パターンを生成し,これも学習パターンにする.次に,学習パターンを,統計的に推測されるその類似パターンも表す特徴ベクトルに変換する.特徴ベクトルは,2点の相対的な距離や位置向きを表す.さらに,その特徴ベクトルから,その統計的な特徴を表す特徴ベクトルも生成する.学習パターンが3個与えられると,文字や混合分布の識別率は飽和することを確認する.
  • クラスタリング手法Dynamic Coalescence Modelの離散化による相対的に不変である位置におけるクラスタの代表点の発見(パターン認識・メディア理解及び一般)
    海田 健, 北島 秀夫, 長谷山 美紀, 富田 眞吾
    電子情報通信学会技術研究報告. MVE, マルチメディア・仮想環境基礎, 2007年11月22日, 日本語
    本論文では,クラスタリング手法Dynamic Coalescence Model (DCM)で発見されるクラスタの代表点を,相対的に不変である位置に発見する手法を提案する. DCMでは,点が球で表され,場の概念に基づいて,球を動かして接触した球を凝縮することが繰り返される.凝縮後の球はクラスタの代表点を表す.しかし,球の位置や移動変位は連続値で表される.そのため,球が凝縮される位置を越えて動かされる場合があった.その上,球の移動距離は,他の球から受ける引力の総和の大きさに比例する値である.そのため,単峰であるクラスタの代表点が,その重心から遠い位置に発見される場合が多かった.提案手法では,点が質点で表され,その位置が離散値で表され,質点の移動変位はその加速度を量子化したベクトルで表される.点分布から,その特徴を表し,相対的な位置が不変である,代表点の分布が生成される.本論文では,提案手法の射影や領域分割,文字認識などへの応用の可能性も示す.
  • 男女識別のための足跡画像取得システムの構築 (メディア工学)
    浅水 仁, 長谷山 美紀
    映像情報メディア学会技術報告, 2007年10月, 日本語
  • 超解像処理を用いた高解像度な補間フレームの生成手法に関する検討 (メディア工学)
    瀧澤 誠, 長谷山 美紀
    映像情報メディア学会技術報告, 2007年10月, 日本語
  • ベクトル量子化に基づく適応内挿フィルタ係数の符号化に関する考察 (メディア工学)
    松野 孝也, 近藤 敏志, 長谷山 美紀
    映像情報メディア学会技術報告, 2007年10月, 日本語
  • IFSによるインパルス性雑音により劣化した画像の復元手法--ブロック領域分割を用いた改良のアプローチ (メディア工学)
    西村 浩哉, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2007年10月, 日本語
  • ヘルムホルツ分解定理に基づく静止画像の回転構造および発散構造の検出に関する検討 (メディア工学)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2007年10月, 日本語
  • 霧発生時に撮像された車載カメラ画像の高精度な復元に関する考察 : 霧の劣化モデルのカルマンフィルタへの適用(信号処理,LSI,及び一般)
    平松 朋樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2007年06月14日, 日本語
    本文ではカルマンフィルタを用い,霧の影響により劣化した車載カメラ画像を高精度に復元する手法を提案する.提案手法では,霧発生時に車載カメラにより撮像された画像からレーンマーキング等の複比を用いた消失点の推定を行うことで,霧の劣化モデルにおけるパラメータの自動設定を可能とする.さらに,パラメータが自動設定された霧の劣化モデルをカルマンフィルタの観測モデルにおける観測方程式として用いる.また,状態遷移モデルとして動画像に対して動きベクトルを用いたフレーム間での輝度値の推定とその誤差を補正するモデルを導入する.これにより提案手法では,隣接するフレーム間の相関を用いた高精度な復元が実現される.
  • 霧発生時に撮像された車載カメラ画像の高精度な復元に関する考察 : 霧の劣化モデルのカルマンフィルタへの適用(信号処理,LSI,及び一般)
    平松 朋樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2007年06月14日, 日本語
    本文ではカルマンフィルタを用い,霧の影響により劣化した車載カメラ画像を高精度に復元する手法を提案する.提案手法では,霧発生時に車載カメラにより撮像された画像からレーンマーキング等の複比を用いた消失点の推定を行うことで,霧の劣化モデルにおけるパラメータの自動設定を可能とする.さらに,パラメータが自動設定された霧の劣化モデルをカルマンフィルタの観測モデルにおける観測方程式として用いる.また,状態遷移モデルとして動画像に対して動きベクトルを用いたフレーム間での輝度値の推定とその誤差を補正するモデルを導入する.これにより提案手法では,隣接するフレーム間の相関を用いた高精度な復元が実現される.
  • 霧発生時に撮像された車載カメラ画像の高精度な復元に関する考察 : 霧の劣化モデルのカルマンフィルタへの適用(信号処理,LSI,及び一般)
    平松 朋樹, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2007年06月14日, 日本語
    本文ではカルマンフィルタを用い,霧の影響により劣化した車載カメラ画像を高精度に復元する手法を提案する.提案手法では,霧発生時に車載カメラにより撮像された画像からレーンマーキング等の複比を用いた消失点の推定を行うことで,霧の劣化モデルにおけるパラメータの自動設定を可能とする.さらに,パラメータが自動設定された霧の劣化モデルをカルマンフィルタの観測モデルにおける観測方程式として用いる.また,状態遷移モデルとして動画像に対して動きベクトルを用いたフレーム間での輝度値の推定とその誤差を補正するモデルを導入する.これにより提案手法では,隣接するフレーム間の相関を用いた高精度な復元が実現される.
  • バスケットボール映像における高精度な選手位置推定のための一考察(画像工学2,ITS画像処理,映像メディア,一般)
    佐久間 大輔, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月16日, 日本語
    本稿では,バスケットボール映像において高精度に選手位置を推定する手法を提案する.提案手法では,色ヒストグラムを基に動物体を追跡するMean-Shift法を利用する.このとき,隣接フレームにおける各選手の追跡結果からオクルージョンの影響を受けた選手を特定する処理をMean-Shift法に導入する.さらに,提案手法ではこのような選手を安定して追跡するために,オクルージョン発生以降のフレームにおいて,発生前と色ヒストグラムが類似する領域を探索する.これにより,オクルージョンに対し頑強な選手追跡が実現され,選手位置の高精度な推定が可能となる.本稿の最後では,提案手法を実際に放送されたバスケットボール映像へ適用し,その有効性について評価を行う.
  • 動画像のモーフィングによるフレーム補間の高精度化 : コントロールポイントの設定に関する一検討(メディア工学5,ITS画像処理,映像メディア,一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月16日, 日本語
    本文では,モーフィングを用いた高精度なフレーム補間法を提案する.提案手法では,動画像の各フレーム間において撮像物体の対応付けを行い,得られる対応を用いてモーフィングを行うことで補間フレームを生成する.モーフィングにより高精度な中間画像を生成するためには,撮像物体の特徴を考慮する必要がある.そこで,提案手法は,各フレームにおいて撮像物体の特徴点を抽出し,得られる特徴点に基づいて対応付けを行う.これにより,撮像物体の適切な対応付けを実現し,高精度な補間フレームの生成を可能とする.本文の最後では,提案手法を実際の動画像に適用し,高精度なフレーム補間結果が得られたので,それを報告する.
  • バスケットボール映像における高精度な選手位置推定のための一考察(画像工学2,ITS画像処理,映像メディア,一般)
    佐久間 大輔, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月16日, 日本語
    本稿では,バスケットボール映像において高精度に選手位置を推定する手法を提案する.提案手法では,色ヒストグラムを基に動物体を追跡するMean-Shift法を利用する.このとき,隣接フレームにおける各選手の追跡結果からオクルージョンの影響を受けた選手を特定する処理をMean-Shift法に導入する.さらに,提案手法ではこのような選手を安定して追跡するために,オクルージョン発生以降のフレームにおいて,発生前と色ヒストグラムが類似する領域を探索する.これにより,オクルージョンに対し頑強な選手追跡が実現され,選手位置の高精度な推定が可能となる.本稿の最後では,提案手法を実際に放送されたバスケットボール映像へ適用し,その有効性について評価を行う.
  • 動画像のモーフィングによるフレーム補間の高精度化 : コントロールポイントの設定に関する一検討(メディア工学5,ITS画像処理,映像メディア,一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月16日, 日本語
    本文では,モーフィングを用いた高精度なフレーム補間法を提案する.提案手法では,動画像の各フレーム間において撮像物体の対応付けを行い,得られる対応を用いてモーフィングを行うことで補間フレームを生成する.モーフィングにより高精度な中間画像を生成するためには,撮像物体の特徴を考慮する必要がある.そこで,提案手法は,各フレームにおいて撮像物体の特徴点を抽出し,得られる特徴点に基づいて対応付けを行う.これにより,撮像物体の適切な対応付けを実現し,高精度な補間フレームの生成を可能とする.本文の最後では,提案手法を実際の動画像に適用し,高精度なフレーム補間結果が得られたので,それを報告する.
  • リンク解析に基づくクラスタリング結果を利用したHITSの改善に関する一考察(メディア工学4,ITS画像処理,映像メディア,一般)
    武吉 朋也, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月15日, 日本語
    本文では,リンク構造の類似性に着目したHITSの改善法を提案する.HITSは,リンク構造の解析によりWebページに対してスコア付けを行う代表的手法であり,その改善手法も種々提案されている.しかしながら,従来手法では個人または一つの団体が作成したWebページと,これをコピーしたページ,さらにはこれらからリンクを張られているページのみが高いスコアを得るという問題が存在する.そこで,提案手法ではスコア付けの対象となるWebページの集合に対し,予め各Webページがもつリンク構造の類似性に着目したクラスタリングを行う.得られたクラスタにはある一つの団体が作成したページと,そのコピーが含まれる可能性が高い.従って,同じクラスタに属する複数のWebページと,一つのWebページの間にリンクが多数存在する場合に,これらのリンクの重みを減少させ,スコア付けを行う.これにより,従来手法ではスコアを得やすいリンク構造をもつWebページが高いスコアを得ることが抑制され,提案手法では様々な検索目的や好みをもつユーザの要求に応えることが可能となる.本文の最後では,提案手法の有用性を示すため比較実験を行う.
  • エッジの連続性を考慮したIFSに基づく画像の拡大に関する検討(メディア工学3及び映像表現&CG,ITS画像処理,映像メディア,一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月15日, 日本語
    本文では,Iterated Function System(IFS)に基づく画像拡大法を提案する.提案手法では,従来のIFS画像拡大法で問題となるエッジの不連続を抑制するため,IFSの拡大処理の過程にラインプロセスを導入する.ラインプロセスはエッジの連続性に注目して,その位置を推定する手法であるが,画像の全ての輝度値が既知である場合に適用可能であり,輝度値が未知である拡大後の画像には適用できない.したがって提案手法では,拡大対象画像にラインプロセスを適用して取得されるエッジから拡大後の画像のエッジを推定し,得られるエッジに基づき,IFSの再構成処理で拡大後の画像の輝度値を算出する.その結果,得られる画像では,エッジの不連続が抑制される.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する.
  • メロディーとリズムに着眼した音楽信号の類似度に関する一考察(メディア工学3及び映像表現&CG,ITS画像処理,映像メディア,一般)
    今野 聡司, 二反田 直己, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月15日, 日本語
    本稿では,楽曲中のリズムに着眼し,楽曲間の類似度を算出する新たな手法を提案する.提案手法では,音楽信号より算出される自己相関関数により楽曲のリズムを表現し,DTWを適用することで類似度を算出する.これにより,楽曲のリズムに基づく適切な類似度算出を可能とする.さらに,提案手法は,メロディーに基づく楽曲間の類似度を併せて用いることで,類似度の可視化を試みる.これにより,提案手法の類似楽曲検索への応用を検討する.
  • サッカー映像におけるグループ戦術解析のための一考察(メディア工学3及び映像表現&CG,ITS画像処理,映像メディア,一般)
    今 宏史, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月15日, 日本語
    本稿では,サッカー映像において,戦術上関連がある選手のグループに対して解析を行うことで,チームが優勢な度合(以降,グループ優勢度)を算出する手法を提案する.提案手法ではまず,選手をグループに分類する.そして,各グループにおいて,選手間が有する戦術的な関係を選手の位置関係に基づいて推定する.選手の関係がわかれば,各選手の戦術上の役割や状況などがわかる.このことから,グループ内の選手の関係を評価することでどちらのチームが戦術上優位な状況にいる選手が多いのかを推定できる.したがって,提案手法では選手の関係に基づいてグループ優勢度を算出する.提案手法によってグループ優勢度を算出し,可視化することで,視聴者の試合内容の理解を補助することや,戦術的な観点からのインデキシングの実現が期待できる.
  • エッジを考慮した類似画像分類の高精度化に関する考察(メディア工学1,ITS画像処理,映像メディア,一般)
    渡辺 隆志, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月15日, 日本語
    本稿では,データベース中に含まれる画像を類似した画像の集合に分類する手法を提案する.以前我々は,画像を色ヒストグラム間の2次形式距離に基づいて分類し,さらに画像の構図に着目することで分類結果の高精度化を図る手法を提案した.しかしながら,予め定義した少数の構図のみを用いていたため,画像中の色の分布について十分に考慮することができず,異なる被写体を撮像した画像であっても,同一の集合に分類されてしまうことが確認された.そこで本稿では,画像中のより詳細な色分布に着目した新たな類似画像分類手法を導入する.提案手法では,画像中の色分布について考慮することが可能である色コリログラムを用い,K-means法により画像の分類を行う.さらに,エッジとその周辺画素の色に着目した再分類処理を施すことで,より高精度な類似画像分類を実現する.
  • ネオコグニトロンを用いた類似画像分類の高精度化に関する一考察 : 色特徴量を抽出する新たな機構の導入(メディア工学1,ITS画像処理,映像メディア,一般)
    大原 貴都, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. IE, 画像工学, 2007年02月15日, 日本語
    本文では,データベース中の画像を自動で分類する手法の提案を行う.これまでに我々は,画像の構造に基づいた特徴量として主にエッジに着目し,ニューラルネットワークの一つであるネオコグニトロンに入力することで,類似した画像の分類を実現した.しかしながら,この手法で用いられる特徴量は,撮像方向が異なる場合等において変化しやすく,同一の対象を撮像した画像であっても,異なるクラスタに分類される可能性がある.そこで,本文では画像のエッジと色情報に基づいた分類手法を提案する.色情報の一つである色ヒストグラムは,撮像方向の変化に影響を受けにくい特徴量として知られている.したがって,提案手法では画像の色ヒストグラムを特徴量とした自己組織化マップによる分類を行う.さらに,得られた分類結果に基づいてネオコグニトロンにおける最終層の構造を適応的に変更することで,画像のエッジに加え,色情報を考慮した高精度な分類を可能とする.本文の最後では,提案手法の有効性を示すために実験を行い,その分類性能を評価する.
  • リンク解析に基づくクラスタリング結果を利用したHITSの改善に関する一考察(メディア工学4,ITS画像処理,映像メディア,一般)
    武吉 朋也, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月15日, 日本語
    本文では,リンク構造の類似性に着目したHITSの改善法を提案する.HITSは,リンク構造の解析によりWebページに対してスコア付けを行う代表的手法であり,その改善手法も種々提案されている.しかしながら,従来手法では個人または一つの団体が作成したWebページと,これをコピーしたページ,さらにはこれらからリンクを張られているページのみが高いスコアを得るという問題が存在する.そこで,提案手法ではスコア付けの対象となるWebページの集合に対し,予め各Webページがもつリンク構造の類似性に着目したクラスタリングを行う.得られたクラスタにはある一つの団体が作成したページと,そのコピーが含まれる可能性が高い.従って,同じクラスタに属する複数のWebページと,一つのWebページの間にリンクが多数存在する場合に,これらのリンクの重みを減少させ,スコア付けを行う.これにより,従来手法ではスコアを得やすいリンク構造をもつWebページが高いスコアを得ることが抑制され,提案手法では様々な検索目的や好みをもつユーザの要求に応えることが可能となる.本文の最後では,提案手法の有用性を示すため比較実験を行う.
  • エッジの連続性を考慮したIFSに基づく画像の拡大に関する検討(メディア工学3及び映像表現&CG,ITS画像処理,映像メディア,一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月15日, 日本語
    本文では,Iterated Function System(IFS)に基づく画像拡大法を提案する.提案手法では,従来のIFS画像拡大法で問題となるエッジの不連続を抑制するため,IFSの拡大処理の過程にラインプロセスを導入する.ラインプロセスはエッジの連続性に注目して,その位置を推定する手法であるが,画像の全ての輝度値が既知である場合に適用可能であり,輝度値が未知である拡大後の画像には適用できない.したがって提案手法では,拡大対象画像にラインプロセスを適用して取得されるエッジから拡大後の画像のエッジを推定し,得られるエッジに基づき,IFSの再構成処理で拡大後の画像の輝度値を算出する.その結果,得られる画像では,エッジの不連続が抑制される.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する.
  • メロディーとリズムに着眼した音楽信号の類似度に関する一考察(メディア工学3及び映像表現&CG,ITS画像処理,映像メディア,一般)
    今野 聡司, 二反田 直己, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月15日, 日本語
    本稿では,楽曲中のリズムに着眼し,楽曲間の類似度を算出する新たな手法を提案する.提案手法では,音楽信号より算出される自己相関関数により楽曲のリズムを表現し,DTWを適用することで類似度を算出する.これにより,楽曲のリズムに基づく適切な類似度算出を可能とする.さらに,提案手法は,メロディーに基づく楽曲間の類似度を併せて用いることで,類似度の可視化を試みる.これにより,提案手法の類似楽曲検索への応用を検討する.
  • サッカー映像におけるグループ戦術解析のための一考察(メディア工学3及び映像表現&CG,ITS画像処理,映像メディア,一般)
    今 宏史, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月15日, 日本語
    本稿では,サッカー映像において,戦術上関連がある選手のグループに対して解析を行うことで,チームが優勢な度合(以降,グループ優勢度)を算出する手法を提案する.提案手法ではまず,選手をグループに分類する.そして,各グループにおいて,選手間が有する戦術的な関係を選手の位置関係に基づいて推定する.選手の関係がわかれば,各選手の戦術上の役割や状況などがわかる.このことから,グループ内の選手の関係を評価することでどちらのチームが戦術上優位な状況にいる選手が多いのかを推定できる.したがって,提案手法では選手の関係に基づいてグループ優勢度を算出する.提案手法によってグループ優勢度を算出し,可視化することで,視聴者の試合内容の理解を補助することや,戦術的な観点からのインデキシングの実現が期待できる.
  • エッジを考慮した類似画像分類の高精度化に関する考察(メディア工学1,ITS画像処理,映像メディア,一般)
    渡辺 隆志, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月15日, 日本語
    本稿では,データベース中に含まれる画像を類似した画像の集合に分類する手法を提案する.以前我々は,画像を色ヒストグラム間の2次形式距離に基づいて分類し,さらに画像の構図に着目することで分類結果の高精度化を図る手法を提案した.しかしながら,予め定義した少数の構図のみを用いていたため,画像中の色の分布について十分に考慮することができず,異なる被写体を撮像した画像であっても,同一の集合に分類されてしまうことが確認された.そこで本稿では,画像中のより詳細な色分布に着目した新たな類似画像分類手法を導入する.提案手法では,画像中の色分布について考慮することが可能である色コリログラムを用い,K-means法により画像の分類を行う.さらに,エッジとその周辺画素の色に着目した再分類処理を施すことで,より高精度な類似画像分類を実現する.
  • ネオコグニトロンを用いた類似画像分類の高精度化に関する一考察 : 色特徴量を抽出する新たな機構の導入(メディア工学1,ITS画像処理,映像メディア,一般)
    大原 貴都, 小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2007年02月15日, 日本語
    本文では,データベース中の画像を自動で分類する手法の提案を行う.これまでに我々は,画像の構造に基づいた特徴量として主にエッジに着目し,ニューラルネットワークの一つであるネオコグニトロンに入力することで,類似した画像の分類を実現した.しかしながら,この手法で用いられる特徴量は,撮像方向が異なる場合等において変化しやすく,同一の対象を撮像した画像であっても,異なるクラスタに分類される可能性がある.そこで,本文では画像のエッジと色情報に基づいた分類手法を提案する.色情報の一つである色ヒストグラムは,撮像方向の変化に影響を受けにくい特徴量として知られている.したがって,提案手法では画像の色ヒストグラムを特徴量とした自己組織化マップによる分類を行う.さらに,得られた分類結果に基づいてネオコグニトロンにおける最終層の構造を適応的に変更することで,画像のエッジに加え,色情報を考慮した高精度な分類を可能とする.本文の最後では,提案手法の有効性を示すために実験を行い,その分類性能を評価する.
  • バスケットボール映像における高精度な選手位置推定のための一考察
    佐久間 大輔, 長谷山 美紀
    電子情報通信学会技術研究報告. SDM, シリコン材料・デバイス, 2007年01月25日, 日本語
  • 動画像のモーフィングによるフレーム補間の高精度化 : コントロールポイントの設定に関する一検討
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. SDM, シリコン材料・デバイス, 2007年01月25日, 日本語
  • 音楽信号におけるフレーズに着眼したメロディー検出に関する一考察
    今野 聡司, 二反田 直己, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • PCAを用いたオーディオ信号の分類法 : MGDを用いた分類の高精度化に関する一検討
    二反田 直己, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • ネオコグニトロンを用いた類似画像分類に関する考察
    大原 貴都, 小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • アクティブネットを用いたサッカー映像におけるパスコースの推定
    今 宏史, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • オプティカルフローを用いた全方位動画像におけるカメラの移動方向推定に関する考察
    高橋 寛明, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • 色ヒストグラムを用いた類似画像分類に関する考察
    渡辺 隆志, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • 動き補償予測誤差に基づく適応内挿フィルタ選択手法に関する考察
    松野 孝也, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年10月30日, 日本語
  • バスケットボール映像における選手位置推定に関する検討
    佐久間 大輔, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年08月31日, 日本語
  • 拘束条件の適応的選択を導入した静止画像中に存在する消失テクスチャの再構成に関する検討
    小川 貴弘, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年08月31日, 日本語
  • ERアルゴリズムを用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : カーネル主成分分析を用いた新たな拘束条件の導入(信号処理,LSI,及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2006年06月16日, 日本語
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失領域の高精度な復元手法を提案する.我々はテクスチャ画像の特徴から,対象画像中の異なる位置に存在する局所領域間において,カーネル関数により高次元特徴空間へ写像される画像およびフーリエ振幅が互いに類似すると仮定する.さらに,復元対象領域の画像およびそのフーリエ振幅を高次元特徴空間へ写像した結果が,それぞれに対して対象画像から生成される固有空間内に存在するように,ERアルゴリズムの拘束条件を設定する.これにより,提案手法では復元対象領域に対して高精度なフーリエ振幅の算出および,その誤差が再構成領域に影響を与えにくい位相の回復を可能とし,消失領域の高精度な復元を実現する.
  • 動画像のフレーム補間に関する考察 : モーフィングを用いたアプローチ(信号処理,LSI,及び一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. CAS, 回路とシステム, 2006年06月16日, 日本語
    本文では,モーフィング技術を用いた動画像のフレーム補間法を提案する.提案手法では,動画像の隣接する2フレーム間に存在する動物体の対応を,フレーム間における動き推定の結果を用いて自動で設定する.さらに,得られる対応に基づきモーフィングを行い,フレーム補間を実現する.ある画像から異なる画像に滑らかに変化する過程の画像を生成することが可能なモーフィング技術を用いることで,提案手法では動物体が滑らかに変化する高精度な補間フレームを生成することが可能となる.
  • ERアルゴリズムを用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : カーネル主成分分析を用いた新たな拘束条件の導入(信号処理,LSI,及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2006年06月16日, 日本語
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失領域の高精度な復元手法を提案する.我々はテクスチャ画像の特徴から,対象画像中の異なる位置に存在する局所領域間において,カーネル関数により高次元特徴空間へ写像される画像およびフーリエ振幅が互いに類似すると仮定する.さらに,復元対象領域の画像およびそのフーリエ振幅を高次元特徴空間へ写像した結果が,それぞれに対して対象画像から生成される固有空間内に存在するように,ERアルゴリズムの拘束条件を設定する.これにより,提案手法では復元対象領域に対して高精度なフーリエ振幅の算出および,その誤差が再構成領域に影響を与えにくい位相の回復を可能とし,消失領域の高精度な復元を実現する.
  • 動画像のフレーム補間に関する考察 : モーフィングを用いたアプローチ(信号処理,LSI,及び一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. SIP, 信号処理, 2006年06月16日, 日本語
    本文では,モーフィング技術を用いた動画像のフレーム補間法を提案する.提案手法では,動画像の隣接する2フレーム間に存在する動物体の対応を,フレーム間における動き推定の結果を用いて自動で設定する.さらに,得られる対応に基づきモーフィングを行い,フレーム補間を実現する.ある画像から異なる画像に滑らかに変化する過程の画像を生成することが可能なモーフィング技術を用いることで,提案手法では動物体が滑らかに変化する高精度な補間フレームを生成することが可能となる.
  • ERアルゴリズムを用いた静止画像中に存在する輝度値消失領域の復元に関する考察 : カーネル主成分分析を用いた新たな拘束条件の導入(信号処理,LSI,及び一般)
    小川 貴弘, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2006年06月16日, 日本語
    本文では,位相回復手法の一つであるERアルゴリズムを用いた静止画像中に存在する消失領域の高精度な復元手法を提案する.我々はテクスチャ画像の特徴から,対象画像中の異なる位置に存在する局所領域間において,カーネル関数により高次元特徴空間へ写像される画像およびフーリエ振幅が互いに類似すると仮定する.さらに,復元対象領域の画像およびそのフーリエ振幅を高次元特徴空間へ写像した結果が,それぞれに対して対象画像から生成される固有空間内に存在するように,ERアルゴリズムの拘束条件を設定する.これにより,提案手法では復元対象領域に対して高精度なフーリエ振幅の算出および,その誤差が再構成領域に影響を与えにくい位相の回復を可能とし,消失領域の高精度な復元を実現する.
  • 動画像のフレーム補間に関する考察モーフィングを用いたアプローチ(信号処理,LSI,及び一般)
    山本 貴史, 長谷山 美紀
    電子情報通信学会技術研究報告. VLD, VLSI設計技術, 2006年06月16日, 日本語
    本文では,モーフィング技術を用いた動画像のフレーム補間法を提案する.提案手法では,動画像の隣接する2フレーム間に存在する動物体の対応を,フレーム間における動き推定の結果を用いて自動で設定する.さらに,得られる対応に基づきモーフィングを行い,フレーム補間を実現する.ある画像から異なる画像に滑らかに変化する過程の画像を生成することが可能なモーフィング技術を用いることで,提案手法では動物体が滑らかに変化する高精度な補間フレームを生成することが可能となる.
  • GMRFモデルを用いた静止画像における失われた輝度値の復元(画像・映像処理)
    小川 貴弘, 長谷山 美紀, 北島 秀夫
    電子情報通信学会論文誌. D, 情報・システム, 2006年06月01日, 日本語
    本論文では,GMRFモデルを用いた静止画像における失われた輝度値の復元手法を提案する.画像中に存在する輝度値消失領域を高精度に復元するためには,エッジ部を精度良く再構成する必要がある.そこで,我々はGMRFモデルを用いて,特に失われたエッジ部を高精変に復元する手法の実現を試みる.このとき,提案手法において用いられるGMRFモデルは,画像が複数の領域により構成され,各領域は弱定常な確率過程であるという仮定のもとで導出される.したがって,提案手法のモデルは画像中の異なる領域間でエッジの表現が可能となり,エッジ部において高精度な復元結果を与える.更に,・このモデルは輝度値消失領域に複数の領域が合まれ,それらが複数のエッジを構成する場合についても,その適用が可能であり,このような場合に従来手法が抱えていた問題である再構成されたエッジ部の過剰な平滑化が抑制される.本論文の最後では,提案手法の有効性を示すために実画像を用いた比較実験を行い,エッジ部における復元性能を評価する.
  • 動画像へのフラクタル符号化の適用法に関する一考察
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • 共起を利用した学術論文の関連性の定量化とその可視化に関する一考察
    鎌倉 純一, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • 領域別適応処理によるセルアニメーション画像の高品質化
    山口 巧, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • 領域に依存したフィルタ設計による高品質な画像圧縮に関する考察
    山浦 隆博, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • 映像からの逆行者検知方法
    新井 啓之, 安野 貴之, 水上 緑, 長谷山 美紀
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • ERアルゴリズムを用いた消失テクスチャ再構成法の高精度化に関する考察 : ERアルゴリズムの拘束条件に用いる部分空間の検討
    小川 貴弘, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • ラインプロセスに着眼したIFSに基づくディジタル画像拡大法の高精度化に関する検討
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月21日, 日本語
  • オーディオ信号を用いたオーディオビジュアルインデキシングの高精度化に関する一検討
    二反田 直己, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月20日, 日本語
  • アクティブネットを用いたサッカー映像解析に関する一考察
    今 宏史, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月20日, 日本語
  • サッカー映像における動的輪郭モデルを用いた選手追跡に関する一考察
    渡辺 友樹, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月20日, 日本語
  • 形状に基づく分裂型輪郭モデルを用いた動物体追跡の高精度化に関する考察
    横山 幸徳, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月20日, 日本語
  • 音楽信号における高精度な和音推定に関する一考察 : 低周波数域に存在する単音に着眼したアプローチ
    今野 聡司, 二反田 直己, 長谷山 美紀, 北島 秀夫
    映像情報メディア学会技術報告, 2006年02月20日, 日本語
  • 領域に依存したフィルタ設計による高品質な画像圧縮に関する考察(符号化I,ITS映像メディア及び一般)
    山浦 隆博, 長谷山 美紀, 北島 秀夫
    電子情報通信学会技術研究報告. ITS, 2006年02月14日, 日本語
    現在,DVD,ディジタル放送などのビデオ符号化方式として,MPEG-2が広く用いられている.MPEG-2は,ブロック単位での動き補償とDCTを用い,効率的に圧縮を実現している.しかしながら,低ビットレートで符号化を行った場合,復号画像にブロックひずみやリンギングなどの劣化が発生するという問題がある.そこで,以前我々は,これらの劣化を軽減するために,符号化側でフレームごとに符号化誤差を最小にする2次元FIRフィルタを設計し,その係数を符号に付加する手法を提案した.本文では,フィルタの設計をフレームごとではなく,復号画像のエッジの方向に注目して領域分割を行い,その領域ごとにフィルタ設計を行う手法を提案する.本提案手法を用いることで,従来手法と比較して,より高品質な画像を得ることが可能となる.
  • ERアルゴリズムを用いた消失テクスチャ再構成法の高精度化に関する考察 : ERアルゴリズムの拘束条件に用いる部分空間の検討(画像処理II,ITS映像メディア及び一般)
    小川 貴弘, 長谷山 美紀, 北島 秀夫
    電子情報通信学会技術研究報告. ITS, 2006年02月14日, 日本語
    本文では,位相回復手法の一つであるER(Error Reduction)アルゴリズムを用いた静止画像中に存在する消失テクスチャの高精度な再構成法を提案する.提案手法ではERアルゴリズムで用いられる拘束条件を,復元対象領域およびそのフーリエ振幅がそれぞれ対象画像中の複数の局所領域およびそれらのフーリエ振幅から生成される二つの部分空間内に存在するように設定する.これにより,復元対象領域において未知であるフーリエ振幅および位相の推定が可能となり,消失領域の再構成が可能となる.さらに,提案手法では復元対象領域およびそのフーリエ振幅についてそれぞれ類似した局所領域とフーリエ振幅を選択し,これらを二つの部分空間の生成に用いている.これにより,得られる部分空間は復元対象領域に対して適応的に生成され,提案手法では高精度な消失テクスチャの再構成が可能となる.本文の最後では,提案手法の有効性を示すために実験を行い,その復元性能を評価する.
  • ラインプロセスに着眼したIFSに基づくディジタル画像拡大法の高精度化に関する検討(画像処理II,ITS映像メディア及び一般)
    覚幸 典弘, 小川 貴弘, 長谷山 美紀, 北島 秀夫
    電子情報通信学会技術研究報告. ITS, 2006年02月14日, 日本語
    本文では,Iterated Function System(IFS)に基づく画像拡大法を提案する.IFSでは原画像とはサイズが異なる画像を再構成することが可能である.この特徴を用いて,IFSによる画像拡大法が従来より提案されている.しかしながら,従来手法により拡大された画像では,IFSによる処理の最小単位であるレンジブロックの境界において輝度値の不連続,およびエッジの不連続が発生する.これは,従来手法が重ならないレンジブロックを用いていること,および隣接するレンジブロックの境界においてエッジの連続性を考慮せず処理を行っていることによる.そこで提案手法では,レンジブロックの境界における輝度値の不連続を抑制するため,レンジブロックを重なりを許して選択可能とする.さらに,拡大処理の過程にラインプロセスを導入する.このとき,ラインプロセスを用いて得られるエッジは連続性を持つことから,拡大画像においてエッジの連続性が保たれる.以上に示す提案手法を用いれば,高精細な拡大画像を得ることが可能となる.本文の最後では,提案手法の有効性を示すため比較実験を行い,その拡大性能を評価する.
  • 動画像へのフラクタル符号化の適用法に関する一考察(符号化II,ITS映像メディア及び一般)
    竹沢 恵, 真田 博文, 渡辺 一央, 長谷山 美紀
    電子情報通信学会技術研究報告. ITS, 2006年02月14日, 日本語
    画像符号化手法の一つとして知られているフラクタル画像符号化は,画像の自己相似性を利用し,画像データを圧縮する.よって,得られる復号画像の品質は自己相似性と密接な関係があると考えられる.しかしながら,従来,この自己相似性と復号画質との関係について明らかにされてこなかった.そこで,以前我々は,これらの関係を明らかにするために,画像が持つ自己相似性の高さを表すための指標を示し,静止画像を対象として自己相似性と復号画質との関係について考察を行った.本文では,この自己相似性と復号画質との関係に基づき,フラクタル画像符号化の動画像への新たな適用法について考察を行う.

所属学協会

  • 情報処理学会               
  • 日本学術会議               
  • 米国IEEE               
  • 電子情報通信学会               
  • 映像情報メディア学会               
  • 日本工学アカデミー               

共同研究・競争的資金等の研究課題

  • 生成AIとの融合により潜在的嗜好を把握可能とするユーザ中心推薦技術の構築
    科学研究費助成事業
    2024年04月01日 - 2028年03月31日
    長谷山 美紀, 斉藤 直輝, 小川 貴弘, 藤後 廉
    日本学術振興会, 基盤研究(B), 北海道大学, 24K02942
  • 低演算量・低容量畳み込みスパース表現技術の構築
    科学研究費助成事業 基盤研究(C)
    2018年04月01日 - 2022年03月31日
    小川 貴弘, 長谷山 美紀
    本研究では、低演算量・低容量畳み込みスパース表現技術の構築を目指す。具体的に、表現係数をバイナリとすることで、「最近傍基底探索に基づくスパース近似」と「単純な加算のみの辞書学習」を可能とし、画質評価指標に一切依存しない低演算量の畳み込みスパース表現を実現するものである。令和元年度は、「畳み込みバイナリスパース表現の実現」に関する研究開発を実施した。具体的に、前年度までに実現されたバイナリスパース表現に関する理論に、畳み込みスパース表現手法を導入することで、表現能力の向上とさらなる演算量の削減を目指した。本研究実施の結果、畳み込みスパース表現を用いることにより、対象画像をよりスパースな表現係数で高精度に近似可能となるため、バイナリスパース表現における最近傍基底の探索回数・辞書学習における加算回数の削減による低演算量化と近似性能の向上を同時に実現した。以上に加えて、バイナリスパース表現の汎用性検証についても実施しており、本表現方法が、画質評価指標に依存せずに適用することが可能であり、これまでの平均二乗誤差に基づく評価指標のみで導出可能であった問題を、他の指標、特に偏微分が困難な指標においても同様に適用可能になることを明らかにした。これまで、多くの画質評価指標が提案されているが、これらを用いたスパース表現の解析的な最適化が困難である問題に対して、ブレークスルーを生み出すことが可能になった。実際の画像復元、具体的に超解像やインペインティングの問題に対して適用することで、新しい画質評価指標に基づいた画像の再構成が高精度に可能になることも明らかにした。
    日本学術振興会, 基盤研究(C), 北海道大学, 18K11367
  • 次世代高精度検索を実現するスーパーマルチモーダル人間情報解析基盤
    科学研究費助成事業 基盤研究(B)
    2017年04月01日 - 2022年03月31日
    長谷山 美紀, 高橋 翔, 小川 貴弘, 畠山 泰貴
    本研究では、センサーデータを利用することで、ユーザの興味を正確に推定可能な次世代高精度検索を目指し、それを実現するためのスーパーマルチモーダル人間情報解析基盤を実現する。本基盤によって、検索対象となるマルチメディアコンテンツに留まらず、ユーザの行動履歴や取り巻く多様なセンサーのデータを統合的に解析可能とし、従来の興味の推定精度の限界を超える次世代高精度検索を実現した。具体的に、次の4技術で構築した。
    技術1 ユーザを取り巻くセンサーを用いて興味推定を行う多種類センサーデータ統合解析技術
    技術2 異なる種類のデータの関連性をグラフ化し、興味推定を高精度化する超グラフ解析技術
    技術3 データの時間的変化を考慮して技術2の興味推定を高精度化する動的超グラフ解析技術
    技術4 技術1~3により得られるユーザの興味推定結果に基づき、SNS等の異なる情報源からコンテンツの提示を可能とする異種情報源データ検索技術(実施中)
    以上の研究において、特筆すべき実績を以下で説明する。本研究では、異種モダリティ間の関連性を表現可能な画像生成モデル・キャプショニングモデルを構築し、与えられるクエリの種類に依存しない検索手法を実現した。具体的に、敵対的画像生成ネットワークを中心とする最新の深層学習に基づくモデルを導入することで、ユーザの興味を正確にとらえたコンテンツの生成を可能とし、最新の画像検索手法と比較して高精度な検索結果の提示が可能となっている。これらの理論は、実際にシステムとして構築され、例えば、ユーザからより自由度の高いテキストの文章をクエリとして与えられた際にも正確にマルチメディアコンテンツを検索することが可能になることが明らかとなっている。
    日本学術振興会, 基盤研究(B), 北海道大学, 17H01744
  • 脳卒中手浴ケアプログラムのランダム化試験による長期的効果の実証とガイドライン作成
    科学研究費助成事業 基盤研究(B)
    2015年04月01日 - 2018年03月31日
    矢野 理香, 長谷山 美紀, 吉田 祐子, 下田 智子, 秋山 雅代
    これまでに開発した手浴ケアの成果モデルと手浴ケア分析システムを一体化させ、「脳卒中手浴ケアプログラム」とした。しかし、手浴ケア前後の対象者の心身のポジティブな変化は示されたものの、同じ温浴である足浴には同様の効果はないのか、手浴特有の効果なのか、ADL、在院日数の変化などの長期的効果は明らかではなく、臨床への普及・定着には至っていない。そこで、本研究の目的は、医療施設への導入と普及に向けて、医療施設への導入と普及に向けて、脳卒中手浴ケアプログラムによる介入の長期的効果を、継続して実証し、ガイドラインを作成することとした。
    日本学術振興会, 基盤研究(B), 北海道大学, 15H05061
  • 自然史財の総合的研究
    科学研究費助成事業 基盤研究(B)
    2014年04月01日 - 2018年03月31日
    馬渡 駿介, 柁原 宏, 大原 昌宏, 松浦 啓一, 長谷山 美紀, 牛嶋 仁, 西田 治文, 岸本 健雄, 長濱 嘉孝
    研究課題である「自然史財の総合的研究」を将来にわたって遂行する組織としての国立自然史博物館の設立に的を絞って活動を行い、成果を得た。具体的な成果は、4年間に渡っていくつかの地域で行ったシンポジウムで披露し、10以上の雑誌記事に結実した。その結果、自然史財研究の場としての国立自然史博物館の設立が現実味を帯びてきた。国立沖縄自然史博物館設立準備委員会は一般法人化され、ホームページhttps://sites.google.com/view/okinawa-natural-history-museum/も開設された。
    今回の研究成果を踏まえ、今後は自然史財研究の進展が期待される。
    日本学術振興会, 基盤研究(B), 北海道大学, 26282067
  • 生物多様性を規範とする革新的材料技術
    科学研究費助成事業 新学術領域研究(研究領域提案型)
    2012年06月28日 - 2017年03月31日
    下村 政嗣, 長谷山 美紀, 石田 秀輝, 針山 孝彦, 森 直樹, 劉 浩, 大園 拓哉, 穂積 篤, 細田 奈麻絵, 齋藤 正男, 野村 周平, 松尾 保孝, 居城 邦治
    進化適応の結果である生物多様性を、持続可能性をもたらす“壮大なるコンビナトリアル・ケミストリー”と位置つけることで、自然史学、生物学、農学、材料科学、機械工学、情報学、環境政策学、社会学等の研究者による我が国では類を見ない異分野連携研究ネットワークを構築することにより、ニーズ・シーズ・マッチングと発想支援が可能となる「バイオミメティクス・データベース」を編纂し、情報科学による生物から工学への技術移転が可能であることを実証した。
    日本学術振興会, 新学術領域研究(研究領域提案型), 24120001
  • 画像処理諸分野の精度限界を打破する超汎用メディア横断型基底の導出理論構築
    科学研究費補助金(挑戦的萌芽研究)
    2015年 - 2017年
    長谷山 美紀
    本研究では、画像の符号化、復元、認識、検索・推薦等の画像処理諸分野における精度限界を打破する超汎用メディア横断型基底の導出理論を構築した。具体的に、画像とその撮像内容を表すデータの両者を統合的に解析することで、画像の各々の領域に対する意味理解を実現し、同時にその最適な近似を与える基底を導出した。本研究で導出するメディア横断型の基底は、高い汎用性を備えるため、画像処理の様々な分野への応用が可能であり、それらの精度向上が期待できる。したがって、本研究では、得られるメディア横断型基底を広い応用分野に適用することで、各分野においてブレークスルーを与えることが可能であることを明らかにした。
    文部科学省, 挑戦的萌芽研究, 北海道大学, 研究代表者, 競争的資金, 15K12023
  • ユーザの行動に学び変化するマルチメディアコンテンツ生成システムの構築
    科学研究費補助金(基盤研究(B))
    2013年 - 2017年
    長谷山 美紀
    本研究では、ユーザの行動に合わせて適応的に変化するマルチメディアコンテンツ生成システムの構築を行った。具体的に、メディア横断型相関分析法に基づいてユーザの行動とマルチメディアコンテンツ間の関係性を抽出することで、時々刻々変化するユーザの志向をモデル化し、その結果から新種のマルチメディアコンテンツを生成するシステムを実現した。さらに、実現されたシステムを複数のユーザが用いることで、相互にコンテンツを推薦することが可能なシステムを構築した。研究代表者は、本研究で構築された推薦システムを様々な場において実証し、その評価を行っている。
    文部科学省, 基盤研究(B), 北海道大学, 研究代表者, 競争的資金, 25280036
  • バイオミメティクス・データベース構築
    科学研究費補助金(新学術領域研究(研究領域提案型))
    2012年 - 2016年
    野村 周平, 山崎 剛史, 上田 恵介, 松原 始, 篠原 現人, 松浦 啓一, 溝口 理一郎, 来村 徳信, 古崎 晃司, 長谷山 美紀
    国立科学博物館においては、昆虫と魚類の観察、写真撮影のためのデジタルマイクロスコープシステム(キーエンス社製)を購入した。昆虫担当の野村班では17サンプル、539枚の画像を撮影した。魚類担当の篠原班(篠原、松浦)ではサメ類を中心に魚類24科35種の体表面構造の探索を行い、SEM画像およびデジタルマイクロスコープ画像合計1,191枚を撮影し、同時にテキストデータも構築した。2012年9月17日、玉川大学にて開催された日本昆虫学会大会で関連のシンポジウムを開催し、野村が基調講演を行った。篠原班では領域内の他(B01)班と共同で、駿河湾において深海性魚類の採集、標本作成の実習を行った。次年度以降も実施予定。鳥類担当の山崎班(山崎、上田、松原)では鳥の羽毛がもつ特徴的な形質に着目して、SEM観察を行った。防水・撥水性、構造色さらに独特の色彩様式を持つトキに注目して、7種9個体について97画像を作製した。また、学会発表と、色彩について扱った出版による普及啓発活動を行った。データベースの構築を担当する溝口班(溝口、來村、古崎)では、材料研究者が求める機能,生物の生態環境,構造,行動など,生物学・工学の双方の知識を横断した様々な観点から検索可能なデータベースを実現する為のバイオミメティックオントロジーの基本設計を行った.また,外部に公開されている知識源と連携したより広範囲な検索を実現するために,Linked Data技術に対応したデータベースシステムを導入し,本研究課題で利用可能な既存データの情報収集を行った.主に画像解析を担当する長谷山班では、より幅広い生物群への適用を可能とするバイオミメティクスデータベースシステムの組み上げを行った。また、本データベースにおいて、極めて異質なデータ同士の統合を可能とするための理論構築を行い、得られた成果に基づいてシステムへの実装を進めた。
    文部科学省, 新学術領域研究(研究領域提案型), 独立行政法人国立科学博物館, 連携研究者, 競争的資金, 24120002
  • 生物多様性を規範とする革新的材料技術               
    科学研究費補助金(新学術領域研究)
    2012年 - 2016年
    下村 政嗣
    文部科学省, 競争的資金
  • 回復期脳血管障害患者に手の動きの自覚と語りを促す手浴ケアの成果モデルの効果検証
    科学研究費助成事業 基盤研究(B)
    2012年04月01日 - 2015年03月31日
    矢野 理香, 長谷山 美紀, 渡辺 玲奈, 菱沼 典子
    「回復期脳血管障害患者に手の動きの自覚と語りを促す手浴ケアの成果モデル」の臨床的効果を再検証すること、脳血管障害患者の語りを量的質的に分析するためのソフトプログラムを開発することを目的とした。その結果、回復期脳血管障害患者への手浴ケアは、手の動きの自覚を高め、対象者自身の語りを促進し、質的にポジティブな変化をもたらすことが再確認できた。また、「手浴ケア分析システム」を開発し、データの再分析により、その有用性と課題が明らかになった。
    日本学術振興会, 基盤研究(B), 北海道大学, 24390473
  • 画像・音響信号およびテキストデータの融合利用による異種メディア横断検索
    科学研究費補助金(基盤研究(B), 基盤研究(B))
    2009年 - 2012年
    長谷山 美紀, 小川 貴弘, 荒木 健治
    映像検索は、一般に映像データに付与されたメタデータを指標として行われる。高精度なセマンティックメタデータを付与できたとしても、その検索の方式は、キーワードの提示を要求する検索形態に限定され、ユーザの曖昧な要求に応えることはできない。これは、画像や映像、さらには、音楽などのメディアが、固有に保持する性質であり、WWWにおけるテキスト検索にみられる、テキストメディアの性質とは大きく異なる。更に増え続けるディジタルコンテンツを前にして、ユーザが望むコンテンツにいかにして効果的に辿り着くかを考える時、ユーザの曖昧な要求に応える検索環境の実現は必須であり、マルチメディアコンテンツに固有の検索理論の構築が望まれる。本研究では、理論構築に必要な一手法である、ユーザが映像や画像、音楽などをクエリとして与えた場合に望む映像や画像、音楽を推定し、効果的に提示可能なメディア横断型検索手法を提案する。本手法により、多様なメディアのコンテンツの視聴履歴から、個人の嗜好を抽出し、異種メディア間での検索を可能とすることで曖昧なユーザの検索要求に応えるための1技術が実現される。異種メディアを横断する検索手法は、提案されておらず、独創的かつ先駆的研究アプローチといえる。このような研究目的の下、前年度定義した異種メディアコンテンツの距離尺度を用いて、「個人の嗜好を表現可能なモデルの実現」のための研究を進めた。メディア数と分析対象となるコンテンツ数から正準相関分析を行い得られた相関行列を用いることで、ユーザが保持するコンテンツの全体に対して、各々の相違度を算出し、相関行列を算出する際に、ユーザの視聴履歴による重みを導入することで、映像の好みを表現した。既知の特徴から得られた相関行列により、ユーザにとって未知のコンテンツに対して、特徴量を推定する手法を実現した。
    文部科学省, 基盤研究(B), 基盤研究(B), 北海道大学, 研究代表者, 競争的資金, 21300030
  • 個人の経験と思考に基づくユーザ主導型スポーツコンテンツの生成法
    科学研究費補助金(基盤研究(C))
    2006年 - 2008年
    長谷山 美紀
    我々を取り巻く社会は, 今までの物質的価値を重視する社会から, 生活の質を重視し自己実現を求める社会へと変化している. このような社会変化を反映して, ディジタルコンテンツに関する現状は, 高いリアリティの3Dグラフィクスなどを提供するものだけでなく, エクサテイメントなど新しいゲームコンテンツの分野を創出した. しかしながら, これらゲームにおいても, 製作者による既成のコンテンツがユーザに提供されており, 個人が好むコンテンツを自動生成する技術が確立するまでの道のりは依然として遠く, 更なる研究が必要である. そこで, 申請者はその初めのステップとしてサッカー映像に焦点を絞り, 個人が自由に選択した映像ソース(コンテンツ作成の際の参照映像をさす)から, 個人の経験と志向に基づくコンテンツを自動生成する「ユーザ主導型コンテンツ生成手法」の研究構想に至った. 本研究の実施は, 放送コンテンツの単なる提供者とは異なり, さらに, 現状の既成ゲームとも異なる個人の思考に合った娯楽型コンテンツの自動生成システム実現の基礎を築いた.
    文部科学省, 基盤研究(C), 北海道大学, 研究代表者, 競争的資金, 18500068
  • 著作画像の非破壊配信を目的とした新しい著者認証システムの実現
    科学研究費補助金(基盤研究(C))
    2002年 - 2004年
    長谷山 美紀
    音楽データや画像データ等のディジタルコンテンツを配布する際の著作権を保護するために,電子透かし等を埋め込む手法が研究されている.しかしながら,この手法は,元のデータを傷つけることにより透かし情報を埋め込むことから,元の音質あるいは画質を保ったままでデータを配信することが不可能である.しかしながら,芸術性が追求される画像や音楽データについては,著作物の品質を保ったままオリジナルデータを提供し,かつ,著作権を守ることが必要である.このような必要性から、オリジナルデータを公開していながらも,無断転載に対して,著作物であることを主張するためのシステムの実現を目指し、本研究課題を進めた。今年度は3年の研究期間における最終年度であり、昨年度定義した著作画像と著作画像であることを主張したい画像の距離をもちいて、著作画像およびそれに類似した画像の検索システムを完成させた。また、このシステムを画像検索へ応用する可能性についても検討し、その成果を特許出願した(12.研究成果による工業所有権の出願・取得状況に記載)。
    文部科学省, 基盤研究(C), 北海道大学, 研究代表者, 競争的資金, 14550343
  • 異言語間障壁通過のための化身話技法の開発と国際通信規格化への基礎研究
    科学研究費助成事業 基盤研究(A)
    2001年 - 2003年
    青木 由直, 長谷山 美紀, 荒木 健治, 山本 強, 山形 積治, 青木 直史
    言語の壁を越えた新しい非言語コミュニケーション技法を化身話(avatar language)という概念に沿って開発し、将来このようなコミュニケーション方式の国際標準化が行われる場合に備えての知見を得ておくことを目的として基礎的研究を行った。化身話の基本となる動作や顔の表情をCG技法で制作する技法を開発し、これらの技法を用いた化身話チャッティングの有効性を検証した。開発技法を異言語間でのコミュニケーションに利用するため、日韓の化身話コミュニケーションを対象に選んでモデル実験を行い、化身話チャッティングの基礎的な知見を得た。電子メール等に使用されている顔文字と表情を結びつけるシステムを表情作成エディターと共に開発した。このシステムでは、笑っている表情の顔文字に+や++の記号を付け加えることで、漫画的に表現した顔における笑いの度合いを、目や口等の部品の形状に反映させて表情を量的に制御できるシステムの開発に成功した。その際、漫画的表情を表す部品をどのように変化させるかに関して制作方式を考案し、これをComic Action Unitと呼ぶことにして、一種の標準化の基礎にできる点を明らかにした。さらに、化身話入力システム、つまり人間の動作の入力インターフェースについても研究成果を得ている。これは、動作の際に生じる加速度を感知する加速度センサーとその信号処理を行うCPUを組み込んだものであり、空間に円や三角形を描く違いを認識して、そのような動作により表現される化身話の素動作の認識に成功している。インターネットを介した遠隔教育での化身話利用を考え、そのモデルを想定し検討を行った。化身話を携帯電話やモバイルPCで用いるために、携帯電話による通信等で化身話でのコミュニケーションが行える環境を構築し、シミュレーションにより、実用化に向けてのデータを得ることに成功した。
    日本学術振興会, 基盤研究(A), 北海道大学, 13305026
  • 通信衛星ネットワークによる知的作業空間構築と化身話を用いた遠隔共同利用法の開発
    科学研究費助成事業 地域連携推進研究費
    1999年 - 2001年
    青木 由直, 飯田 浩二, 清水 孝一, 山本 強, 初田 健, 藤原 祥隆, 長谷山 美紀
    本研究の目的の一つである、北海道地域の主要大学間での通信衛星ネットワーク環境の整備を進めながら、知的共同作業空間構築のための基礎技法の開発を行った。その際知的共同作業に利用するために、化身話(Avatar Language)と呼ぶ新しい概念を導入して技法の開発と実験を行った。研究グループは北海道大学(工学研究科と水産科学研究科)、北見工業大学、北海道工業大学、室蘭工業大学に大まかに分かれていて、各大学に所属する研究代表者と分担者がそれぞれのテーマで研究を遂行した。このうち、北大工学研究科グループでは、表情や身体動作のCG表現による化身話技法の開発研究、化身話コミュニケーション実験、通信衛星による画像伝送、画像処理、生体情報伝送、化身話の基礎となる動画や音声メディアに関する研究、Webページを有効に利用した学習支援、楽器演奏支援システム、電子透かし技法、通信衛星により配信された遠隔学習番組のモニタと評価等を主な研究テーマとして研究を行い、成果を得た。北見工大グループでは衛星通信のインフラを強化しつつ、知識ベースを利用した遠隔学習支援システムの構築を行い、JCSAT通信衛星を利用した教材配信に関して研究成果を得た。北海道工大ではJCSATも利用した衛星通信の通信時における伝播特性に関する測定実験を行い、都市部における電波障害対策のための衛星通信方式を提案した。また通信衛星によるCPU間接続のインターフェースの開発を行った。室蘭工大ではこの種のコミュニケーションにおけるセキュリティ対策について、自動暗号化処理サーバの試作を行って研究成果を得ている。研究テーマと関連して、札幌と韓国の企業との連携の橋渡しを行い、韓国のAvatar技術の企業が技術展示のための来札を支援し、その際化身話技法に関する意見交換を行った。
    日本学術振興会, 地域連携推進研究費, 北海道大学, 11792011
  • 生物の脳細胞の振舞いを利用したマルチエージェント画像認識システム
    科学研究費補助金(奨励研究(A))
    1999年 - 2000年
    長谷山 美紀
    生物の脳細胞の振舞いを利用したマルチエージェント画像認識システムの構築を行うにあたり,次のアプローチで研究を進めた.既に研究代表者は,画像認識のニューラルネットにおいて,エッジ部分を認識するユニット(ニューロンに対応)とテクスチャ(模様パターンの様子)を認識するユニットが形成されている事が解っていた.この事実をふまえて,生物の脳細胞の振舞いを利用したマルチエージェント画像認識システムの構築を試みた.上記試みの過程で,画像のテクスチャ解析を含むエッジ抽出手法が必要となった.そこで,研究代表者は,画像テクスチャの解析を可能とする高品質領域分割システムを構築した(11.研究発表1番で発表).構築された領域分割システムは,遺伝的アルゴリズムを基に実現され,従来法では困難であった異なる内部テクスチャを持つ領域が混在している画像にも応用が可能である.さらに,上の画像のテクスチャ解析を含む領域分割手法をテクスチャがノイズで汚された画像に応用するために,ノイズを除去する処理が必要となった.従来の手法は,ノイズの量が多い場合に,そのノイズ除去効果が著しく低下し,使用に耐えないため,研究代表者は,テクスチャを保存したままで,高品質なノイズ除去を可能とする手法を構築した(11.研究発表1および2で発表).このノイズ除去手法は,世界で初めてIFS(Iterated Function System)を利用したノイズ除去手法である.その特徴から既存の手法には無い高精度なノイズ除去が可能となった.
    文部科学省, 奨励研究(A), 北海道大学, 研究代表者, 競争的資金, 11750357
  • 生物神経細胞の働きを模擬したニューラルネットによる画像認識システムの構築
    科学研究費補助金(奨励研究(A))
    1997年 - 1998年
    長谷山 美紀
    生物細胞の働きを模擬したニューラルネットによる画像認識システムの構築の研究を行なうにあたり、今年度は、昨年度の研究成果である、ARMAモデル(パラメトリックモデルの一つ)から少ない計算量で合成信号を生成する手法を発表した(11.研究発表1番で発表)。また、昨年度に引続きパラメトリックモデルにおける非線形処理について考察した。その結果、ニューラルネットの各ユニットが画像認識を行う過程で、画像を内部テクスチャの類似した領域を最小単位として捉えている傾向が確認された。この事実は、Suga教授(米国ワシントン大学)が1973年に発見した実際の生物のニューロンの発火状態がその処理対象によって、限られた個数のクラスに分類されると言う事実に類似している。このような類似性が発見された事から、本ニューラルネットを、画像認識への適用を試みることによって、中間層の働きに新たな知見が得られる可能性が大いにある。研究は現在も継続中であり、今後も興味深い事実の発見が期待できる。また、上記研究の過程で、研究代表者は、画像のテクスチャ解析を可能とする領域分割システムを構築した。(11.研究発表2番で発表予定)。構築された領域分割システムは、遺伝的アルゴリズムを基に実現され、従来法では困難であった異なる内部テクスチャを持つ領域が混在している画像にも応用が可能である。研究成果の発表は両者共に、論文印刷時に科学研究費の援助を受けた研究である事を明示した。
    文部科学省, 奨励研究(A), 北海道大学, 研究代表者, 競争的資金, 09750465
  • 遺伝的アルゴリズムを用いたフィルタ実現法
    科学研究費補助金(奨励研究(A))
    1996年 - 1996年
    長谷山 美紀
    計算機上で設計されたフィルタを実際に用いる場合には、フィルタ係数を量子化する必要がある。一般に計算機上では実数を64ビット(倍精度の場合)で表現している。しかしながら、実際に、オ-ディオシステムや計測器などで用いられるフィルタを実現する際には、製造にかかるコストなどから16ビット程度の語長でしか表現することが許されない。従来は、64ビットで算出された理想的なフィルタの係数を四捨五入、切捨てなどの手法で量子化してきた。ところが、このようにして量子化されたフィルタは、その特性劣化が最小とは限らない。特性劣化が最小なフィルタを得るためには、例えば10個の係数を持つフィルタを16ビットで量子化する場合、10×2^<16>=655360個のフィルタの中から1つを選ぶことになる。つまり、全てのフィルタを実現し、その結果に基づいて選ぶのは、実際には不可能である。本研究では、遺伝的アルゴリズムを用いて、上記のような実際には不可能であった最適フィルタ選択のための探索を可能とした。提案手法は、遺伝的アルゴリズムを用いているため、応用対象に適した遺伝子の設計が最大の問題となる。我々は、フィルタ係数をコード化する事により等長遺伝子を設計し、フィルタ係数量子化への応用を可能とした。また、提案手法は、その探索過程で安定なフィルタのみを生成するという特徴があり、最終的に得られたフィルタは安定なフィルタである事が保証される。本提案手法は、高速伝送(低ビットレート伝送)や集積回路の小型化に役立つと考えられ、更なる発展が期待できる。
    文部科学省, 奨励研究(A), 北海道大学, 研究代表者, 競争的資金, 08750489
  • ウェーブレット解析を用いた画像処理についての研究
    科学研究費補助金(奨励研究(A))
    1994年 - 1994年
    長谷山 美紀
    本研究は、ウェーブレット解析を画像処理も効果的に応用する手法の構築を目的として始められた。1次元信号処理にウェーブレット解析が応用される場合と、2次元信号に応用する場合の違いは、時刻をどのように扱うかにある。従って、まず、2次元信号において時刻をどのように位置付けるかを考察した。その結果、2次元信号を異った複数の1次元信号の集まりと考えた。現在この考えのもとに、ウェーブレット解析を行なっている途中である。一方、上で述べた考え方から線形モデルの標準形と呼ばれるARMAX(Auto Regressive Moving Average Exogenous)モデルを同定する高速算法が導出できた。これは、3つの異った1次元信号の入出力関係を表すARMAXモデルのパラメータを高速に算出するものであり、異った1次元信号の集まりを、1つのモデルとして扱うという先に述べた発想から生まれたものである。このような高速算法は、他では提案されておらず、IEEEの主催する国際会議であるICASSP-95(1995 International Conference on Acoustics,Speech & Signal Processing5月1日より開催)及び、ISCAS'95(1995International Symposium on Circuits And Systems5月9日より開催)に発表論文がすでに採択されている。
    文部科学省, 奨励研究(A), 北海道大学, 研究代表者, 競争的資金, 06855037
  • 脳波信号におけるα波の高精度抽出についての研究
    科学研究費補助金(奨励研究(A))
    1991年 - 1991年
    長谷山 美紀
    文部科学省, 奨励研究(A), 北海道大学, 研究代表者, 競争的資金, 03855088
  • 高機能なヒューマンインターフェース実現のための信号処理手法の構築               
    競争的資金

産業財産権

メディア報道

  • CO2吸収量 森林の9倍               
    2023年09月28日
    北海道新聞
    [新聞・雑誌]
  • 雑海藻駆除によりCO2吸収効果が4.5倍に 天然コンブ育成がゼロカーボンに貢献               
    2023年09月28日
    きたリンク NEWS
    [新聞・雑誌]
  • コンブがCO2吸収               
    2023年09月27日
    北海道建設新聞
    [新聞・雑誌]
  • 北大とデジタル人材育成               
    2023年08月24日
    日本経済新聞
    [新聞・雑誌]
  • ニトリが育てるデジタル人材 北海道大学と共同研究               
    2023年08月23日
    日本経済新聞電子版
    [新聞・雑誌]
  • コンブで脱炭素後押し               
    2023年07月02日
    北海道新聞
    [新聞・雑誌]
  • えりも沿岸域ブルーカーボンによるCO2吸収量推計検討会を開催               
    2023年06月21日
    港湾新聞
    [新聞・雑誌]
  • 【第19回】「ChatGPT」など大規模言語モデルの仕組みと土木領域での可能性               
    2023年06月20日
    BUILT - ITmedia
    [新聞・雑誌]
  • 藻場でCO2吸収量調査               
    2023年06月11日
    日高報知新聞
    [新聞・雑誌]
  • えりも沿岸域でブルーカーボン               
    2023年06月08日
    北海道建設新聞
    [新聞・雑誌]
  • コンブのCO2吸収量 年内にも算出               
    2023年06月08日
    北海道新聞
    [新聞・雑誌]
  • えりも町 海中で二酸化炭素を吸収「ブルーカーボン」の検討会               
    2023年06月07日
    NHK NEWS WEB
    [新聞・雑誌]
  • 高度な技術者 産学で育成               
    2023年05月28日
    読売新聞
    [新聞・雑誌]
  • ブルーカーボン CO2吸収量調査 えりも町コンブ漁場で               
    2023年04月26日
    北海道建設新聞
    [新聞・雑誌]
  • 北海道開発局、えりも町で「ブルーカーボン」調査               
    2023年04月26日
    日本経済新聞
    [新聞・雑誌]
  • 北大女性6教授が先端研究               
    2023年04月26日
    読売新聞
    [新聞・雑誌]
  • 北大女性6教授が先端研究 多分野ユニット               
    2023年04月25日
    読売新聞オンライン
    [新聞・雑誌]
  • 「多様な視点を通して、ライフスタイルに変革を」異なる分野の女性教授6人による研究ユニット 北海道大学に発足               
    2023年04月19日
    HBC NEWS
    [新聞・雑誌]
  • ICLR 2023 | 解决VAE表示学习问题,北海道大学提出新型生成模型GWAE               
    2023年04月03日
    机器之心(中国)
    [新聞・雑誌]
  • デジタル人材 産学官で育成               
    2023年02月22日
    北海道新聞
    [新聞・雑誌]
  • 北海道経産局、デジタル人材育成へ協議会 北大など参加               
    2023年02月21日
    日本経済新聞電子版
    [新聞・雑誌]
  • インフラDXで地方創生               
    2023年02月14日
    北海道建設新聞
    [新聞・雑誌]
  • 浓缩就是精华:用大一统视角看待数据集蒸馏               
    2023年01月19日
    CVer(中国)
    [新聞・雑誌]
  • 2022 Top10自监督学习模型总结               
    2022年12月06日
    极市平台(中国)
    [新聞・雑誌]
  • 若手起業家に投資不可欠 大学でデジタル人材育成               
    2022年11月16日
    日本経済新聞
    [新聞・雑誌]
  • 若手起業家に投資不可欠 大学でデジタル人材育成               
    2022年11月16日
    日本経済新聞電子版
    [新聞・雑誌]
  • 2022 Top10自监督学习模型发布!美中两国8项成果霸榜               
    2022年11月12日
    新智元(中国)
    [新聞・雑誌]
  • Top 10 Self-supervised Learning Models in 2022               
    2022年11月02日
    Analytics India Magazine
    [新聞・雑誌]
  • 一个项目帮你了解数据集蒸馏Dataset Distillation               
    2022年10月09日
    极市平台(中国)
    [新聞・雑誌]
  • 一个项目帮你了解数据集蒸馏Dataset Distillation               
    2022年10月09日
    机器之心(中国)
    [新聞・雑誌]
  • データ経営 大学にも到来               
    2022年09月14日
    日本経済新聞 朝刊, pp.31
    [新聞・雑誌]
  • データ経営、大学にも到来 他大学と比較や地域課題解決               
    2022年09月14日
    日本経済新聞電子版
    [新聞・雑誌]
  • 北大など、インフラ点検効率化へ               
    2022年06月25日
    日本経済新聞
    [新聞・雑誌]
  • 標識補修AIお知らせ               
    2022年06月25日
    北海道新聞, pp.30
    [新聞・雑誌]
  • ドローンとAIで道路標識など管理 開発局と北大が共同研究へ               
    2022年06月24日
    NHK NEWS WEB
    [新聞・雑誌]
  • AI使い道路標識など管理 開発局が北大と共同研究へ               
    2022年06月21日
    NHK NEWS WEB
    [新聞・雑誌]
  • 北大でシンポジウム開催 情報連携による防災・減災               
    2022年05月31日
    日本経済新聞
    [新聞・雑誌]
  • 北海道大学がデータビジネス拠点 副学長「世界に発信」               
    2022年01月22日
    日本経済新聞電子版
    [新聞・雑誌]
  • 老朽施設点検に先進技術               
    2021年12月15日
    北海道新聞 朝刊
    [新聞・雑誌]
  • 河川構造物監視自動化 開発局 AI画像解析技術を活用               
    2021年11月12日
    北海道通信
    [新聞・雑誌]
  • 解析活用へ初会合 河川管理、AIで高度化               
    2021年11月12日
    北海道建設新聞
    [新聞・雑誌]
  • ニトリの挑戦!発祥の地、北海道に活気を けいナビ               
    2021年09月11日
    けいナビ
    [新聞・雑誌]
  • 北海道発、世界一めざせ ブランニューHOKKAIDO               
    2021年09月10日
    日本経済新聞
    [新聞・雑誌]
  • 「北海道から世界へ」日経北海道印刷50年でシンポ ブランニューHOKKAIDO               
    2021年09月09日
    日本経済新聞電子版
    [新聞・雑誌]
  • 日経 道内印刷50年記念シンポジウム               
    2021年08月27日
    Yahoo! ニュース
    [新聞・雑誌]
  • 「経済再開の戦略議論を」 本社、北海道印刷50年シンポ               
    2021年08月27日
    日本経済新聞電子版
    [新聞・雑誌]
  • 熟練技術継承に先端技術               
    2021年08月25日
    読売新聞
    [新聞・雑誌]
  • AI新時代/住友ゴム工業 タイヤ構造、見える化               
    2021年07月30日
    日刊工業新聞
    [新聞・雑誌]
  • タイヤ構造 見える化               
    2021年07月30日
    日刊工業新聞
    [新聞・雑誌]
  • ネイチャーインデックスに掲載 住友ゴムのAI技術研究成果               
    2021年07月19日
    ゴムタイムス
    [新聞・雑誌]
  • AI技術の共同研究成果 Nature Indexに掲載               
    2021年07月15日
    ゴム化学新聞
    [新聞・雑誌]
  • 住友ゴムと北大、AI技術の共同研究成果が研究成果のデータベース「Nature Index」の材料科学特集 として掲載               
    2021年07月02日
    日本経済新聞電子版
    [新聞・雑誌]
  • Artificial intelligence gets to grip with tyres               
    2021年07月01日
    Nature Index
    [新聞・雑誌]
  • AI活用でインフラ点検               
    2021年06月16日
    日本経済新聞, pp.27
    [新聞・雑誌]
  • 「北大BI」他大学展開 研究データ経営戦略活用               
    2021年02月27日
    日刊工業新聞
    [新聞・雑誌]
  • 札幌発のデータサイエンティスト育成へ ニトリと北大               
    2021年02月15日
    日本経済新聞電子版
    [新聞・雑誌]
  • 如何让人工智能技术更亲民               
    2021年01月08日
    环球科学(中国)
    [新聞・雑誌]
  • DX時代、地域と人材育成               
    2021年01月08日
    日本経済新聞
    [新聞・雑誌]
  • How to Make Artificial Intelligence More Democratic               
    2021年01月02日
    Deccan Herald
    [新聞・雑誌]
  • How to Make Artificial Intelligence More Democratic               
    2021年01月02日
    Scientific American
    [新聞・雑誌]
  • データサイエンス教育セミナー 数理の重要性を学ぶ               
    2020年12月14日
    北海道通信社日刊教育版
    [新聞・雑誌]
  • IT人材奨学金北大院生5人に               
    2020年10月17日
    北海道新聞
    [新聞・雑誌]
  • ニトリの財団、IT人材育成へ奨学金 DX推進支援               
    2020年10月16日
    日本経済新聞電子版
    [新聞・雑誌]
  • 北海道大学みらいIT人財奨学金 1期生決まる 似鳥国際奨学財団               
    2020年10月16日
    北海道新聞どうしん電子版
    [新聞・雑誌]
  • 「社会創造」で豊かに               
    2020年05月22日
    日刊工業新聞
    [新聞・雑誌]
  • タイヤ開発、AIで加速               
    2019年11月05日
    日経産業新聞, pp.8
    [新聞・雑誌]
  • Microsoft Customer Story-NEXCO東⽇本がスマートメンテナンスハイウェイで⽬指す、"発展し続けるインフラ情報基盤" とは               
    2019年09月13日
    Microsoft
    [新聞・雑誌]
  • 研究進むAI 理解深める               
    2019年07月30日
    北海道新聞 夕刊
    [新聞・雑誌]
  • データサイエンティスト創出               
    2019年01月29日
    日刊建設工業新聞
    [新聞・雑誌]
  • AIが札幌の観光画像を提案 本学・長谷山研究室がチ・カ・ホで体験イベント               
    2018年12月09日
    北海道大学新聞
    [新聞・雑誌]
  • 北大大学院 長谷山美紀教授インタビュー データの達人、北大が生む               
    2018年07月20日
    北海道新聞 どうしん電子版
    [新聞・雑誌]
  • イネの撥水性やヤモリの接着力               
    2018年04月07日
    産経新聞, pp.16
    [新聞・雑誌]
  • 胃X線画像からピロリ感染を判断するAIも開発進む               
    2018年03月10日
    日経メディカル
    [新聞・雑誌]
  • 札幌市はインバウンド観光施策へ,競合の小売り同士で購買データを共有               
    2017年02月09日
    【Web】日経BigData, pp.1-5
    [新聞・雑誌]
  • インフラ劣化判定支援               
    2016年12月14日
    北海道建設新聞, pp.3
    [新聞・雑誌]
  • モデル事務所で導入               
    2016年07月22日
    【新聞】日刊 建設工業新聞, pp.4
    [新聞・雑誌]
  • 維持管理技術向上へ               
    2016年04月13日
    【新聞】北海道建設新聞, pp.3
    [新聞・雑誌]
  • 異分野連携で大きな成果               
    2015年12月13日
    【新聞】北海道新聞 日曜版, pp.2
    [新聞・雑誌]
  • 先端科学 研究者が解説               
    2015年11月14日
    【新聞】北海道新聞 朝刊 地方 函館・渡島・桧山, pp.14
    [新聞・雑誌]
  • NECソリューションイノベータなど開発へ この害虫なんて虫? スマホで撮影→検索→特定               
    2015年08月05日
    【新聞】日本農業新聞, pp.14
    [新聞・雑誌]
  • ピロリ菌感染 高精度で判別               
    2015年02月11日
    熊本日日新聞, pp.11
    [新聞・雑誌]
  • ピロリ感染を自動判別 橋の点検にも活用               
    2015年02月06日
    四国新聞, pp.15
    [新聞・雑誌]
  • 技術100選 人口知能 教育を補助               
    2015年01月30日
    日経産業新聞, pp.3
    [新聞・雑誌]
  • 画像処理でIT追究               
    北海道新聞(日刊) 2面
    [新聞・雑誌]
  • テレビとネット融合 --番組内容表示など役立つ機能が豊富--               
    北海道新聞 21面
    [新聞・雑誌]
  • グーグルを超えろ! 国産検索エンジン               
    テレビ東京 ワールドビジネスサテライト
    [新聞・雑誌]
  • 画像をクエリに似た画像を検索 --Googleイメージ検索はもう古い? CEATECは画像認識が面白い--               
    【Web】@IT総合トップ > @IT CORE > NewsInsight > Googleイメージ検索はもう古い? CEATECは画像認識が面白い
    [新聞・雑誌]
  • 画像から「好み」推測               
    朝日新聞 朝刊 15面
    [新聞・雑誌]
  • 次世代画像検索観光サイト開設               
    日本経済新聞
    [新聞・雑誌]
  • 動産の観光検索技術--実験サイトきょう公開--               
    北海道新聞
    [新聞・雑誌]
  • 動く画像 深層意識を刺激               
    北海道新聞 第3経済面
    [新聞・雑誌]
  • 「右脳的」に画像検索を行うビジュアル・コンテクスト・サーチ               
    【Web】ネットニュース
    [新聞・雑誌]
  • ハイテク自動車 未来へアクセル*ネットで道内ドライブ*風景写真を自動再生*データクラフト               
    北海道新聞朝刊全道 10面
    [新聞・雑誌]
  • 道内2社、画像検索改良事業に採択               
    北海道新聞朝刊全道 8面
    [新聞・雑誌]
  • データクラフト、画像検索技術、楽天サイト内で実験、類似商品集め配置               
    日本経済新聞朝刊 地方経済面 北海道 1面
    [新聞・雑誌]
  • 商品画像「似たもの検索」               
    日経産業新聞
    [新聞・雑誌]
  • 北大とIT4社、パナソニック系と提携、画像検索技術を提供               
    日本経済新聞朝刊 地方経済面 北海道 1面
    [新聞・雑誌]
  • 新画像検索技術を販売*パナソニック*社内ベンチャー設立               
    北海道新聞朝刊全道 9面
    [新聞・雑誌]
  • 文字に頼らずネットで検索               
    室蘭民報 3面
    [新聞・雑誌]
  • 文字に頼らずファイル検索               
    河北新報 夕刊 3面
    [新聞・雑誌]
  • 文字に頼らず検索お任せ               
    新潟日報夕刊 7面
    [新聞・雑誌]
  • 音楽・動画・静止画の検索、キーワード使わず――北大、「エンジン」開発。               
    日経産業新聞 1面
    [新聞・雑誌]
  • ネット上の音楽・動画…、あなたのイメージで検索、北大が開発、キーワード使わず               
    日本経済新聞 地方経済面 1面
    [新聞・雑誌]
  • 経産省、情報大航海プロジェクト技術をイタリア州観光局に提供               
    日刊工業新聞1面
    [新聞・雑誌]
  • 道内で開発 観光情報ネット検索 イタリアの州が採用               
    北海道新聞 8面
    [新聞・雑誌]
  • 情報大航海プロジェクト               
    日刊工業新聞 8面
    [新聞・雑誌]
  • 「似たもの」画像検索技術 通販・SNSに提供               
    日本経済新聞 北海道経済 37面
    [新聞・雑誌]
  • 建物の被害分散 衛生写真から判明               
    朝日新聞朝刊33面
    [新聞・雑誌]
  • 東日本高速を採択 クラウド活用インフラ保守技術開発               
    建設通信
    [新聞・雑誌]
  • 入力語の関連サイト選ぶ               
    読売新聞夕刊 8面
    [新聞・雑誌]
  • 動画検索や監視カメラシステムに高評価 札幌IT15社 海外へ販路               
    北海道新聞 朝刊 全道遅版 経済 8ページ
    [新聞・雑誌]
  • S'pore, Hokkaido ink ideas-to-products deal               
    The Straits Times/money PAGE B19
    [新聞・雑誌]
  • バイオミメティクス 生物模倣が拓く未来               
    BSフジ ガリレオX (2012年6月10日9時半から放映)
    [新聞・雑誌]
  • QIY2012実証実験               
    STV「どさんこワイド179」ニュース
    [新聞・雑誌]
  • 札幌・チカホでサイネージ実験-個人の動き・表情から興味予測し映像上映               
    【Web】Yahoo!ニュース
    [新聞・雑誌]
  • 札幌・チカホでサイネージ実験-個人の動き・表情から興味予測し 映像上映               
    【Web】札幌経済新聞「みんなの経済新聞ネットー ワーク」
    [新聞・雑誌]
  • 通行人の気分画像化               
    北海道新聞朝刊地方札幌 27面
    [新聞・雑誌]
  • 「ICTが解決する社会インフラの課題」 ビッグデータ時代とデータ活用技術の最先端(2)               
    【Web】日経BPケンプラッツ
    [新聞・雑誌]
  • 北海道大、技術革新の着想が得られる発想支援型データベース開発に着手               
    【Web】技術者を応援するサイト Teck-On
    [新聞・雑誌]
  • 自然に学ぶものづくりフォーラム               
    日経新聞, pp.18面(広告ページ)
    [新聞・雑誌]
  • QIY2013実証実験               
    HBC「北海道NEWS1」ニュース
    [新聞・雑誌]
  • お勧め観光情報表示               
    北海道新聞朝刊地方札幌 25面
    [新聞・雑誌]
  • バイオミメティクス・市民セミナー「生物画像から“気づき”を生み出す新しいデータベース」               
    【Web】JST 科学技術振興機構 サイエンスポータル
    [新聞・雑誌]
  • 非構造化データベース管理プラットフォームが可能にするバイオミメティクス・データベース構想               
    日刊工業新聞 10面
    [新聞・雑誌]
  • 日本主導でDB企画作り 生物模倣技術、国際標準化へ               
    日刊工業新聞, pp.10
    [新聞・雑誌]
  • みんなでサイエンス               
    北海道新聞 夕刊 地方 札幌市内, pp.9
    [新聞・雑誌]
  • 自然に学ぶものづくり 生物規範工学への道               
    日刊工業新聞, pp.15
    [新聞・雑誌]
  • ICT活力推進会議が発足               
    北海道建設新聞
    [新聞・雑誌]
  • 高速橋の損傷を画像解析で判断               
    北海道新聞 朝刊, vol.朝刊, pp.4
    [新聞・雑誌]
  • ネクスコ東日本など、ICT使い橋梁点検-過去データで変状確認               
    【Web】朝日新聞DEGITAL
    [新聞・雑誌]
  • 橋の点検にスマホ活用 過去写真と自動照合で損傷評価               
    【Web】日経BPケンプラッツ
    [新聞・雑誌]
  • OASIS実証実験               
    STV「どさんこワイドひる」ニュース
    [新聞・雑誌]
  • 「生物模倣技術」を産業化 8月産学でNPO法人設立               
    日刊工業新聞, pp.13
    [新聞・雑誌]
  • バイオミメティクス研究会、実用化促進に向けたNPOを設立へ               
    【Web】日経BP社 知財Awareness
    [新聞・雑誌]
  • 新製品ヒント生物の体に               
    日本経済新聞 朝刊, pp.14
    [新聞・雑誌]
  • 道内ICT活用重点4事業選定               
    日本経済新聞 朝刊 地方経済面
    [新聞・雑誌]
  • 生物から学ぶモノづくり 環境省、実用化へ基準               
    日刊工業新聞, pp.1
    [新聞・雑誌]
  • 検索システム開発中               
    中日こどもウィークリー, pp.2
    [新聞・雑誌]
  • 進化する画像解析技術               
    静岡新聞, pp.6
    [新聞・雑誌]
  • 画像情報解析で「診断」               
    信濃毎日新聞, pp.9
    [新聞・雑誌]
  • ピロリ菌感染判別、高速道の損傷発見               
    福島民報, pp.12
    [新聞・雑誌]
  • 画像解析 高精度の「目」               
    中国新聞 夕刊, pp.8
    [新聞・雑誌]
  • ピロリ感染、自動判別               
    山梨日日新聞, pp.11
    [新聞・雑誌]
  • ピロリ感染、自動判別               
    中部経済新聞, pp.10
    [新聞・雑誌]
  • 蓄積した画像データと照合 「経験と勘」を再現               
    大分合同新聞 夕刊, pp.9
    [新聞・雑誌]
  • ピロリ感染自動判別               
    山陰中央新報, pp.8
    [新聞・雑誌]
  • 画像解析、高精度に               
    福井新聞, pp.19
    [新聞・雑誌]
  • 画像解析、高精度に               
    岐阜新聞 夕刊, pp.3
    [新聞・雑誌]