研究者データベース

吉岡 真治(ヨシオカ マサハル)
情報科学研究院 情報理工学部門 知識ソフトウェア科学分野
教授

基本情報

所属

  • 情報科学研究院 情報理工学部門 知識ソフトウェア科学分野

職名

  • 教授

学位

  • 博士(工学)(東京大学)

ホームページURL

J-Global ID

研究キーワード

  • ナノインフォマティックス   テキストマイニング   検索者の意図   評価実験   マルチファセット   地理情報   意見分析   設計文書   相関性分析   形式的知識   インタフェース   検索システムの評価   文書管理   フォーマルコンセプト   設計対象モデル   クラスタリング   XML   問題解決   知識の再利用   検索拡張   知識メディア   極大類比   検索要求   アブダクション   セマンティックWeb   アナジロジー   文書構造   設計学   アナロジー   思考過程モデル   国際標準化   検索語拡張   概念の汎化   ストーリー   設計知識   知識マネージメント   オントロジー   検索意図   適合的汎化   シソーラス   電子化辞書   情報検索   

研究分野

  • 情報通信 / データベース
  • 情報通信 / 知能情報学
  • 情報通信 / ヒューマンインタフェース、インタラクション
  • 情報通信 / データベース
  • 情報通信 / 知能情報学

職歴

  • 2019年04月 - 現在 北海道大学 大学院情報科学研究院情報理工学部門 教授
  • 2018年01月 - 2019年03月 北海道大学 大学院情報科学研究科 情報理工学専攻 教授
  • 2014年04月 - 2017年12月 北海道大学 大学院情報科学研究科 准教授
  • 2008年04月 - 2014年03月 北海道大学 大学院情報科学研究科 コンピュータサイエンス専攻 准教授
  • 2004年04月 - 2008年03月 北海道大学 大学院情報科学研究科 コンピュータサイエンス専攻 助教授
  • 2001年06月 - 2004年03月 北海道大学 大学院工学研究科 助教授
  • 2000年04月 - 2001年05月 国立情報学研究所 情報学資源研究センター 助手
  • 1996年04月 - 2000年03月 学術情報センター 助手

所属学協会

  • ACM (Association for Computing Machinery)   言語処理学会   日本機械学会   精密工学会   人工知能学会   情報処理学会   

研究活動情報

論文

  • Juliano Rabelo, Mi-Young Kim, Randy Goebel, Masaharu Yoshioka, Yoshinobu Kano, Ken Satoh
    34 - 49 2019年 [査読有り][通常論文]
  • Yoshinobu Kano, Mi-Young Kim, Masaharu Yoshioka, Yao Lu, Juliano Rabelo, Naoki Kiyota, Randy Goebel, Ken Satoh
    177 - 192 2018年 [査読有り][通常論文]
  • Masaharu Yoshioka, Shinjiro Hara
    Information Search, Integration, and Personalization (Communications in Computer and Information Science (CCIS), edited by D. Kotzinos, D. Laurent, N. Spyratos, Y. Tanaka, and R. Taniguchi, Springer International Publishing, Switzerland, 2019) Vol. 1040 41 - 52 2018年 [査読有り][通常論文]
  • Masaharu Yoshioka, Myungha Jang, James Allan, Noriko Kando
    Proceedings of the Second International Workshop on Recent Trends in News Information Retrieval co-located with 40th European Conference on Information Retrieval (ECIR 2018), Grenoble, France, March 26, 2018. 6 - 8 CEUR-WS.org 2018年 [査読有り][通常論文]
  • Masaharu Yoshioka
    NEW FRONTIERS IN ARTIFICIAL INTELLIGENCE (JSAI-ISAI 2017) 10838 5 - 19 2018年 [査読有り][通常論文]
     
    The Competition on Legal Information Extraction/Entailment (COLIEE) involves the legal question answering task. The information retrieval task for finding relevant articles to questions is one of the subtasks in COLIEE. In this paper, we compare the characteristics of the test data provided in two different language (English and Japanese) and analyze topic difficulty based on the submission data by using the retrieval results of Indri, a state-of-the-art information retrieval system. We also discuss issues relating to the design of new COLIEE information retrieval tasks.
  • Hayato Shiokawa, Kota Kawaguchi, Bingcai Han, Takehito Utsuro, Yasuhide Kawada, Masaharu Yoshioka, Noriko Kando
    NATURAL LANGUAGE PROCESSING TECHNIQUES FOR EDUCATIONAL APPLICATIONS 143 - 151 2018年 [査読有り][通常論文]
     
    Search engine is an important tool of modern academic study, but the results are lack of measurement of beginner friendliness. In order to improve the efficiency of using search engine for academic study, it is necessary to invent a technique of measuring the beginner friendliness of a Web page explaining academic concepts and to build an automatic measurement system. This paper studies how to integrate heterogeneous features such as a neural image feature generated from the image of the Web page by a variant of CNN (convolutional neural network) as well as text features extracted from the body text of the HTML file of the Web page. Integration is performed through the framework of the SVM classifier learning. Evaluation results show that heterogeneous features perform better than each individual type of features.
  • Masaharu Yoshioka
    Workshop and Poster Proceedings of the 8th Joint International Semantic Technology Conference co-located with the 8th Joint International Semantic Technology Conference (JIST 2018), Awaji City, Hyogo, Japan, November 26-28, 2018. 98 - 101 CEUR-WS.org 2018年 [査読有り][通常論文]
  • Masaharu Yoshioka
    KNOWLEDGE GRAPHS AND LANGUAGE TECHNOLOGY 10579 119 - 136 2017年 [査読有り][通常論文]
     
    WC3 (Wikipedia Category Consistency Checker) is a system that supports the analysis of the metadata-annotation style in Wikipedia articles belonging to a particular Wikipedia category (the subcategory of "Categories by parameter") by using the DBpedia metadata database. This system aims to construct an appropriate SPARQL query to represent the category and compares the retrieved results and articles that belong to the category. In this paper, we introduce WC3 and extend the algorithm to analyze efficiently additional varieties of Wikipedia category. We also discuss the metadata-annotation quality of the Wikipedia by usingWC3. URL ofWC3 is http://wnews.ist.hokudai.ac.jp/wc3/ and related files are available at http://wnews.ist.hokudai.ac.jp/wc3/KEKI.
  • Masaharu Yoshioka, Daiki Onodera
    COLIEE 2017. 4th Competition on Legal Information Extraction and Entailment, held in conjunction with the 16th International Conference on Artificial Intelligence and Law (ICAIL 2017) in King's College London, UK. 9 - 22 2017年 [査読有り][通常論文]
  • A multi-faceted figure retrieval system from research papers for supporting nano-crystal device development researchers
    Masaharu Yoshioka, Tao Zhu, Shinjiroh Hara
    The Proceedings of the First International Workshop on ScIentific Document Analysis (SCIDOCA 2016) 2016年11月 [査読有り][通常論文]
  • Civil Code Article Information Retrieval System based on Legal Terminology and Civil Code Article Structure
    Daiki Onodera, Masaharu Yoshioka
    The Proceedings of the 10th International Workshop on Juris-Informatics (JURISIN2016), The Japanese Society of Artificial Intelligence 2016年11月 [査読有り][通常論文]
  • WC3: Analyzing the style of metadata annotation among Wikipedia articles by using Wikipedia category and the DBPedia metadata database.
    Masaharu YOSHIOKA
    Proceedings of the First Workshop on Knowledge Extraction and Knowledge Integration 2016年10月 [査読有り][通常論文]
  • Masaharu Yoshioka, Masahiko Itoh, Michele Sebag
    INFORMATION SEARCH, INTEGRATION, AND PERSONALIZATION, (ISIP 2015) 622 142 - 156 2016年 [査読有り][通常論文]
     
    Data visualization is a core approach for understanding data specifics and extracting useful information in a simple and intuitive way. Visual data mining proceeds by projecting multidimensional data onto two-dimensional (2D) or three-dimensional (3D) data, e.g., through mathematical optimization and topology preserved in multidimensional scaling (MDS). However, this projection does not necessarily comply with the user's needs, prior knowledge and/or expectations. This paper proposes an interactive visual mining approach, centered on the user's needs and allowing the modification of data visualization by leveraging approaches from metric learning. The paper exemplifies the proposed system, referred to as Interactive Metric Learning-based Visual Data Exploration (IMViDE), applied to scientific social network browsing.
  • Masaharu Yoshioka, Noriko Kando
    Proceedings of the First International Workshop on Recent Trends in News Information Retrieval co-located with 38th European Conference on Information Retrieval (ECIR 2016), Padua, Italy, March 20, 2016. 63 - 65 CEUR-WS.org 2016年 [査読有り][通常論文]
  • Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara
    Journal of Information Processing 24 3 554 - 564 2016年 [査読有り][通常論文]
     
    The process of nanocrystal device development is not well systematized. To support this process, analysis of the information produced by developmental experiments is required. In this study, we constructed an annotated corpus to support the extraction of experimental information from relevant publications. We designed the corpus-construction guidelines by cooperating with a domain expert. We evaluated these guidelines through corpusconstruction experiments with graduate students from this domain, and then evaluated the corpus with the domain expert. In the corpus construction experiments, we achieved a sufficient level of Inter-Annotator Agreement by using a loose agreement measure that ignored the term-boundary mismatch problem, and made an agreement corpus that excluded annotations based on misunderstanding the guidelines. The domain expert evaluated this agreement corpus and modified the guidelines based on real examples. Using these guidelines, we finalized the corpus called "NaDev" (Nanocrystal Device development corpus). The NaDev corpus and its construction guidelines will be released via our website, http://nanoinfo.ist.hokudai.ac.jp/. The NaDev corpus aims to support automatic information extraction from publications relevant to nanocrystal device development. This information can be used to solve problems in the nanotechnology domain using the massive availability of fresh information. To the best of our knowledge, this is the first corpus constructed for the development of nanocrystal devices.
  • Extraction of Chemical and Drug Named Entities by Ensemble Learning Using Chemical NER Tools Based on Different Extraction Guidelines
    Thaer M. Dieb, Masaharu Yoshioka
    Transactions on Machine Learning and Data Mining 8 2 61 - 76 2015年10月 [査読有り][通常論文]
  • Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara, Marcus C. Newton
    BEILSTEIN JOURNAL OF NANOTECHNOLOGY 6 1872 - 1882 2015年09月 [査読有り][通常論文]
     
    To support nanocrystal device development, we have been working on a computational framework to utilize information in research papers on nanocrystal devices. We developed an annotated corpus called "NaDev" (Nanocrystal Device Development) for this purpose. We also proposed an automatic information extraction system called "NaDevEx" (Nanocrystal Device Automatic Information Extraction Framework). NaDevEx aims at extracting information from research papers on nanocrystal devices using the NaDev corpus and machine-learning techniques. However, the characteristics of NaDevEx were not examined in detail. In this paper, we conduct system evaluation experiments for NaDevEx using the NaDev corpus. We discuss three main issues: system performance, compared with human annotators; the effect of paper type (synthesis or characterization) on system performance; and the effects of domain knowledge features (e.g., a chemical named entity recognition system and list of names of physical quantities) on system performance. We found that overall system performance was 89% in precision and 69% in recall. If we consider identification of terms that intersect with correct terms for the same information category as the correct identification, i.e., loose agreement (in many cases, we can find that appropriate head nouns such as temperature or pressure loosely match between two terms), the overall performance is 95% in precision and 74% in recall. The system performance is almost comparable with results of human annotators for information categories with rich domain knowledge information (source material). However, for other information categories, given the relatively large number of terms that exist only in one paper, recall of individual information categories is not high (39-73%); however, precision is better (75-97%). The average performance for synthesis papers is better than that for characterization papers because of the lack of training examples for characterization papers. Based on these results, we discuss future research plans for improving the performance of the system.
  • Takehito Utsuro, Yusuke Inoue, Takakazu Imada, Masaharu Yoshioka, Noriko Kando
    Social Media for Government Services 135 - 149 2015年01月01日 [査読有り][通常論文]
     
    This chapter presents a framework of detecting bursty topics of correlated news and twitter, and discusses how to integrate the framework into government services. Especially, as a specific application of the proposed framework of detecting bursty topics of correlated news and twitter, this chapter gives an example of collecting news and twitter that are related to “the 2012 London Olympic game” and applying the proposed framework.
  • Masaharu Yoshioka, Rhett Loban
    2015 11TH INTERNATIONAL CONFERENCE ON SIGNAL-IMAGE TECHNOLOGY & INTERNET-BASED SYSTEMS (SITIS) 712 - 718 2015年 [査読有り][通常論文]
     
    Wikipedia is a free Internet encyclopedia that covers numerous topics and is maintained by voluntary editors. There have been several efforts to analyze the quality of Wikipedia's content, specifically assessing textual content and user editorial behavior. However, there has been no specific analysis of the quality of structured data (e.g., category structures, attributes contained in infoboxes) in Wikipedia. DBPedia is one of a core part of Linked Open Data database which extracts structured information from Wikipedia. Since the quality of DBPedia depends on Wikipedia, it is beneficial to have a mechanism to keep a consistent style of writing of the structured data (metadata) within Wikipedia. In this paper, we propose a system WC3 (WC-triple: Wikipedia Category Consistency Checker) that uses DBPedia RDF-triple information to evaluate the consistency of the metadata related to the Wikipedia category information. We also illustrate examples of typical inconsistencies that the system can assist in detecting.
  • Martin Krallinger, Obdulia Rabal, Florian Leitner, Miguel Vazquez, David Salgado, Zhiyong Lu, Robert Leaman, Yanan Lu, Donghong Ji, Daniel M. Lowe, Roger A. Sayle, Riza Theresa Batista-Navarro, Rafal Rak, Torsten Huber, Tim Rocktaschel, Serergio Matos, David Campos, Buzhou Tang, Hua Xu, Tsendsuren Munkhdalai, Keun Ho Ryu, S. V. Ramanan, Senthil Nathan, Slavko Zitnik, Marko Bajec, Lutz Weber, Matthias Irmer, Saber A. Akhondi, Jan A. Kors, Shuo Xu, Xin An, Utpal Kumar Sikdar, Asif Ekbal, Masaharu Yoshioka, Thaer M. Dieb, Miji Choi, Karin Verspoor, Madian Khabsa, C. Lee Giles, Hongfang Liu, Komandur Elayavilli Ravikumar, Andre Lamurias, Francisco M. Couto, Hong-Jie Dai, Richard Tzong-Han Tsai, Caglar Ata, Tolga Can, Anabel Usie, Rui Alves, Isabel Segura-Bedmar, Paloma Martinez, Julen Oyarzabal, Alfonso Valencia
    JOURNAL OF CHEMINFORMATICS 7 S-1 S2  2015年01月 [査読有り][通常論文]
     
    The automatic extraction of chemical information from text requires the recognition of chemical entity mentions as one of its key steps. When developing supervised named entity recognition (NER) systems, the availability of a large, manually annotated text corpus is desirable. Furthermore, large corpora permit the robust evaluation and comparison of different approaches that detect chemicals in documents. We present the CHEMDNER corpus, a collection of 10,000 PubMed abstracts that contain a total of 84,355 chemical entity mentions labeled manually by expert chemistry literature curators, following annotation guidelines specifically defined for this task. The abstracts of the CHEMDNER corpus were selected to be representative for all major chemical disciplines. Each of the chemical entity mentions was manually labeled according to its structure-associated chemical entity mention (SACEM) class: abbreviation, family, formula, identifier, multiple, systematic and trivial. The difficulty and consistency of tagging chemicals in text was measured using an agreement study between annotators, obtaining a percentage agreement of 91. For a subset of the CHEMDNER corpus (the test set of 3,000 abstracts) we provide not only the Gold Standard manual annotations, but also mentions automatically detected by the 26 teams that participated in the BioCreative IV CHEMDNER chemical mention recognition task. In addition, we release the CHEMDNER silver standard corpus of automatically extracted mentions from 17,000 randomly selected PubMed abstracts. A version of the CHEMDNER corpus in the BioC format has been generated as well. We propose a standard for required minimum information about entity annotations for the construction of domain specific corpora on chemical and drug entities. The CHEMDNER corpus and annotation guidelines are available at: http://www.biocreative.org/resources/biocreative-iv/chemdner-corpus/
  • 複数国の新聞からの多観点比較による分析 ~ GDELT データを用いた分析~ (人工知能学会 研究会優秀賞 受賞)
    吉岡 真治, 神門 典子
    人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会 第8回研究会研究発表予稿集 SIG-AM-08-0 24 - 31 2014年11月 [査読無し][通常論文]
  • Automatic Annotation of Parameters from Nanodevice Development Research Papers
    T. M. Dieb, M. Yoshioka, S. Hara, M. C. Newton
    Proceedings of the 4th International Workshop on Computational Terminology (COMPUTERM 2014), COLING 2014 Workshop, Dublin, Ireland, August 23, 2014: Proceedings of the 4th International Workshop on Computational Terminology, pp. 77-85 (9pp.) 77 - 85 2014年08月 [査読有り][通常論文]
  • Masaharu Yoshioka
    INFORMATION RETRIEVAL TECHNOLOGY, AIRS 2014 8870 470 - 481 2014年 [査読有り][通常論文]
     
    Wikipedia is a free encyclopedia on the Internet that contains millions of articles. Wikipedia ontologies (e.g., YAGO2 and the Japanese Wikipedia ontology) have been constructed to utilize the semantic information in this encyclopedia; in these ontologies, the category information from each article is used to construct concept hierarchies. However, Wikipedia categories were originally designed for navigation, to help users find appropriate articles, and they are not equivalent to concept hierarchies in Wikipedia ontologies. In this study, we briefly review the definition of a category in Wikipedia and exhaustively investigate the category structure in the Japanese Wikipedia. We also discuss how category structure information can be utilized to construct an ontology and to calculate a semantic similarity measure.
  • Ensemble Approach to Extract Chemical Named Entity
    Masaharu Yoshioka, Thaer M. Dieb
    Proceedings of the fourth BioCreative challenge evaluation workshop, vol. 2, 162 - 167 2013年10月 [査読無し][通常論文]
  • Bursty Topics in Time Series Japanese / Chinese News Streams and their Cross-Lingual Alignment
    Liyi Zheng, Takehito Utsuro, Masaharu Yoshioka
    Proceedings of the 13th Conference of the Pacific Association for Computational Linguistics 2013年09月 [査読有り][通常論文]
  • ナノ知識探索プロジェクト:実験記録からの知識発見 (第3報) – Nanodevice Research Papers Clustering Based on Automatic Paper Annotation –
    Thaer Moustafa Dieb, 吉岡 真治, 原 真二郎
    2013年度(第27回)人工知能学会全国大会 (JSAI 2013), 富山, 2013年6月4日-7日, 発表論文集, 1C3-4 (4pp.) 1C3-4-1 - 1C3-4-4 2013年06月 [査読有り][通常論文]
  • Masaharu Yoshioka
    Proceedings of the 10th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Quesiton Answering, And Cross-Lingual Information Access, 255 - 259 National Institute of Informatics (NII) 2013年06月 [査読有り][通常論文]
  • 小池 大地, 牧田 健作, 宇津呂 武仁, 河田 容英, 吉岡 真治, 神門 典子
    第5回データ工学と情報マネジメントに関するフォーラム---DEIM フォーラム--- 論文集 2013年03月 [査読無し][通常論文]
  • ニュース・ツイッター間の対応を考慮したバースト・トピックの同定
    高橋 佑介, 胡 碩, 宇津呂 武仁, 吉岡 真治, 神門 典子
    第5回データ工学と情報マネジメントに関するフォーラム---DEIM フォーラム--- 論文集 2013年03月 [査読無し][通常論文]
  • Masaharu Yoshioka, Noriko Kando
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 7774 375 - 381 2013年 [査読有り][通常論文]
     
    It is now possible to use various geographical open data sources such as GeoNames and Wikipedia to construct geographic information systems. In addition, these open data sources are integrated by the concept of Linked Open Data. There have been several attempts to identify links between existing data, but few studies have focused on the quality of such links. In this paper, we introduce an automatic link discovery method for identifying the correspondences between GeoNames entries and Wikipedia pages, based on Wikipedia category information. This method finds not only appropriate links but also inconsistencies between two databases. Based on this integration results, we discuss the type of inconsistencies for making consistent Linked Open Data. © Springer-Verlag 2013.
  • Daichi Koike, Yusuke Takahashi, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando
    Sixth International Joint Conference on Natural Language Processing, IJCNLP 2013, Nagoya, Japan, October 14-18, 2013 917 - 921 Asian Federation of Natural Language Processing / ACL 2013年 [査読有り][通常論文]
  • Masaharu Yoshioka, Takahiro Fujiwara
    Proceedings of the 7th Workshop on Geographic Information Retrieval, GIR 2013 57 - 63 2013年 [査読有り][通常論文]
     
    When processing toponym information in natural language text, it is crucial to have a good gazetteers. There are several well-organized gazetteers for English text, but they do not cover Japanese local toponyms. In this paper, we introduce a Japanese gazetteers based on Open Data (e.g., the Toponym database distributed by Japanese ministries, Wikipedia, and GeoNames) and propose a toponym disambiguation framework that uses the constructed gazetteers. We also evaluate our approach based on a blog corpus that contains place names with high ambiguity.
  • タスクを考慮した情報検索テストコレクション構築に関する考察
    吉岡 真治, 神門典子
    情報アクセスシンポジウム2012 1 - 7 2012年12月 [査読有り][通常論文]
  • Issues for Linking Geographical Open Data of GeoNames and Wikipedia
    Masaharu Yoshioka, Noriko Kando
    Proceedings of the 2nd Joint International Semantic Technology Conference (JIST2012), 2012年12月 [査読有り][通常論文]
  • Cross-Lingual Topic Alignment in Time Series Japanese / Chinese News
    Shuo Hu, Yusuke Takahashi, Liyi Zheng, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando, Tomohiro Fukuhara, Hiroshi Nakagawa, Yoji Kiyota
    Proceedings of the 26th Pacific Asia Conference on Language, Information and Computation 532 - 541 2012年11月 [査読有り][通常論文]
  • ナノ知識探索プロジェクト:ナノデバイス開発記録からの知識発見
    吉岡 真治, Thaer Moustafa Dieb, 原 真二郎
    Designシンポジウム2012, 京都, 2012年10月16日-17日, 発表論文集 (5pp.) 1 - 5 2012年10月 [査読無し][通常論文]
  • 吉岡 真治, 劉 亦奇, 神門 典子
    情報処理学会論文誌. データベース 5 3 141 - 148 一般社団法人情報処理学会 2012年09月 [査読有り][通常論文]
     
    近年,地理情報を扱う情報システムの増加にともない,地理情報に関するデータベースへのニーズが高まっている. GeoNames は, Open Data としては,最大規模の地理情報データベースである.本データベースを Linked Open Data として Wikipedia の情報を媒介として関連づけることにより, Web Ontology の開発などに役立てられている.ただし, GeoNames と Wikipedia の間のリンクについては,自動的なリンク発見の試みがいくつか行われているものの,十分な数のリンクが付与されている状態ではない.本論文では, Wikipedia のカテゴリ情報を使うことで,精度良く Wikipedia のページに対応する GeoNames のエントリを発見する方法を提案する.また,本手法は,既存のリンク中の不適切なリンクを発見する際にも利用可能であることを示す.本手法の成果については,すでに, GeoNames の管理者に報告しており,その成果の一部は, GeoNames 中のリンク情報として公開・修正が行われている.
  • Yusuke Takahashi, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando, Tomohiro Fukuhara, Hiroshi Nakagawa, Yoji Kiyota
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 7614 239 - 249 2012年 [査読有り][通常論文]
     
    This paper focuses on two types of modeling of information flow in news stream, namely, burst analysis and topic modeling. First, when one wants to detect a kind of topics that are paid much more attention than usual, it is usually necessary for him/her to carefully watch every article in news stream at every moment. In such a situation, it is well known in the field of time series analysis that Kleinberg's modeling of bursts is quite effective in detecting burst of keywords. Second, topic models such as LDA (latent Dirichlet allocation) are also quite effective in estimating distribution of topics over a document collection such as articles in news stream. However, Kleinberg's modeling of bursts is usually applied only to bursts of keywords but not to those of topics. Considering this fact, we propose how to apply Kleinberg's modeling of bursts to topics estimated by a topic model such as LDA and DTM (dynamic topic model). © 2012 Springer-Verlag Berlin Heidelberg.
  • Yusuke Takahashi, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando, Tomohiro Fukuhara, Hiroshi Nakagawa, Yoji Kiyota
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 7614 239 - 249 2012年 [査読有り][通常論文]
     
    This paper focuses on two types of modeling of information flow in news stream, namely, burst analysis and topic modeling. First, when one wants to detect a kind of topics that are paid much more attention than usual, it is usually necessary for him/her to carefully watch every article in news stream at every moment. In such a situation, it is well known in the field of time series analysis that Kleinberg's modeling of bursts is quite effective in detecting burst of keywords. Second, topic models such as LDA (latent Dirichlet allocation) are also quite effective in estimating distribution of topics over a document collection such as articles in news stream. However, Kleinberg's modeling of bursts is usually applied only to bursts of keywords but not to those of topics. Considering this fact, we propose how to apply Kleinberg's modeling of bursts to topics estimated by a topic model such as LDA and DTM (dynamic topic model). © 2012 Springer-Verlag Berlin Heidelberg.
  • Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara
    Proceedings of the 2012 IIAI International Conference on Advanced Applied Informatics, IIAIAAI 2012 42 - 47 2012年 [査読有り][通常論文]
     
    To support development processes for nanodevices, we want to utilize the information related to experiments from nanodevice development research papers. In this paper, we propose a new guideline for constructing a tagged corpus of nanodevice development papers to achieve this goal. We also propose the use of a corpus construction support tool. To speed up the construction process, we propose an approach for automatic extraction of experiment-related information from the papers. © 2012 IEEE.
  • Masaharu Yoshioka, Noriko Kando
    International Conference on Information and Knowledge Management, Proceedings 19 - 20 2012年 [査読有り][通常論文]
     
    We propose a novel framework that enables multifaceted analysis of news articles. This system uses semantic annotated information (e.g., person, place) as facets and can be used to construct structured queries for comparing the differences between sets of articles.
  • Masaharu Yoshioka, Noriko Kando
    PROCEEDINGS OF THE FIFTH WORKSHOP ON EXPLOITING SEMANTIC ANNOTATIONS IN INFORMATION RETRIEVAL 19 - + 2012年 [査読有り][通常論文]
     
    We propose a novel framework that enables multifaceted analysis of news articles. This system uses semantic annotated information (e. g., person, place) as facets and can be used to construct structured queries for comparing the differences between sets of articles.
  • 吉岡 真治
    情報処理学会論文誌 52 12 3423 - 3434 情報処理学会 2011年12月15日 [査読無し][通常論文]
     
    効率的な文書データベースに基づいた質問応答システムを構築するためには,情報検索システムの性能の向上が不可欠である.ここで,特定の人や組織に関する質問応答を目的とする場合を考えると,対象となる文書に,これらの人や組織に関する情報が入っていることは不可欠であり,ブーリアン検索モデルに基づいた検索式を利用することが望ましい場合がある.本研究では,人名や組織名に多く存在すると考えられる表記バリエーションのリストと動詞の同義語を考慮することによって,質問応答を考慮した適切なブーリアン検索式を構築するとともに,確率型検索モデルとブーリアン検索モデルを組み合わせた情報検索システムABRIR(Appropriate Boolean query Reformulation for Information Retrieval)を利用したシステムを提案する.また,本システムを地理情報などに関する質問応答のタスクであるNTCIR-8 GeoTimeタスクに適用し,その有効性を検証した.In order to make a good question answering (QA) system based on text database, it is better to have a good information retrieval (IR) system. To make a good IR system for QA about particular named entities, it is better to use Boolean IR model by using appropriate Boolean query. In this paper, we propose to use ABRIR (Appropriate Boolean query Reformulation for Information Retrieval) that constructs appropriate Boolean query by using list of synonyms and variation of Japanese katakana description. Evaluation results shows that ABRIR works effectively for the task of IR for QA (NTCIR-8 Geotime).
  • 吉岡 真治
    情報処理学会論文誌 52 12 3423 - 3434 一般社団法人情報処理学会 2011年12月 [査読有り][通常論文]
     
    効率的な文書データベースに基づいた質問応答システムを構築するためには,情報検索システムの性能の向上が不可欠である.ここで,特定の人や組織に関する質問応答を目的とする場合を考えると,対象となる文書に,これらの人や組織に関する情報が入っていることは不可欠であり,ブーリアン検索モデルに基づいた検索式を利用することが望ましい場合がある.本研究では,人名や組織名に多く存在すると考えられる表記バリエーションのリストと動詞の同義語を考慮することによって,質問応答を考慮した適切なブーリアン検索式を構築するとともに,確率型検索モデルとブーリアン検索モデルを組み合わせた情報検索システムABRIR(Appropriate Boolean query Reformulation for Information Retrieval)を利用したシステムを提案する.また,本システムを地理情報などに関する質問応答のタスクであるNTCIR-8 GeoTimeタスクに適用し,その有効性を検証した.
  • Masaharu Yoshioka, Noriko Kando, Yohei Seki
    Proceedings of the 4th International Workshop on Evaluating Information Access (EVIA), A Satellite Workshop of NTCIR-9, December 6, 2011 Tokyo Japan 20 - 23 National Institute of Informatics (NII) 2011年 [査読有り][通常論文]
  • Fredric C. Gey, Ray R. Larson, Jorge Machado, Masaharu Yoshioka
    Proceedings of the 4th International Workshop on Evaluating Information Access (EVIA), A Satellite Workshop of NTCIR-9, December 6, 2011 Tokyo Japan 9 - 13 National Institute of Informatics (NII) 2011年 [査読有り][通常論文]
  • Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara
    Proceedings - 2011 IEEE International Conference on Granular Computing, GrC 2011 167 - 170 2011年 [査読有り][通常論文]
     
    Nanodevices development process is not well systematized. In order to support this development process, we have been working on an experimental record management system that aims at analyzing previous manufacturing experiments to provide an insight on future manufacturing. However, we found that experimental records do not have enough information for detailed analysis. In this paper, we propose an approach to extract extra information (metadata) from Nanodevices development papers that can enhance the analysis of experimental results. © 2011 IEEE.
  • Masaharu Yoshioka
    Proceedings of the 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-9, National Center of Sciences, Tokyo, Japan, December 6-9, 2011 National Institute of Informatics (NII) 2011年 [査読有り][通常論文]
  • Fredric C. Gey, Ray R. Larson, Jorge Machado, Masaharu Yoshioka
    Proceedings of the 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-9, National Center of Sciences, Tokyo, Japan, December 6-9, 2011 National Institute of Informatics (NII) 2011年 [査読有り][通常論文]
  • Masaharu Yoshioka, Katsuhiro Tomioka, Shinjiroh Hara, Takashi Fukui
    iiWAS2010 - 12th International Conference on Information Integration and Web-Based Applications and Services 871 - 874 2010年 [査読有り][通常論文]
     
    We are developing a framework for knowledge creation in nanodevice development, based on collaboration between nanodevice engineers and computer science researchers. Development of nanodevices requires a variety of knowledge some of this knowledge is tacit, based on the user's experience. Therefore, it is difficult to become a good engineer in this development process. We propose the concept of "Evidence-based experiment planning" and develop a process for supporting experiment planning in nanodevice development. This system applies knowledge discovery techniques to records of previous experiments to extract experienced engineers' tacit knowledge. Copyright 2010 ACM.
  • Hiroyuki Nakasaki, Yusuke Abe, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa, Yoji Kiyota
    Lecture Notes of the Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering 40 315 - 320 2010年 [査読有り][通常論文]
     
    Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for outsiders from abroad who are not familiar with cultures and crimes in foreign countries. This paper proposes a framework of cross-lingually analyzing people's concerns, reports, and experiences on crimes in their own blogs. In the retrieval of blog feeds/posts, we take two approaches, focusing on various types of bloggers such as experts in the crime domain and victims of criminal acts. © Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering 2010.
  • Masaharu Yoshioka
    Proceedings of the 8th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-8, National Center of Sciences, Tokyo, Japan, June 15-18, 2010 154 - 158 National Institute of Informatics (NII) 2010年 [査読有り][通常論文]
  • NSContrast: An Exploratory News Article Analysis System that Characterizes the Differences between News Sites
    Masaharu Yoshioka
    SIGIR2009 Workshop on Information Access in a Multilingual World 25 - 29 2009年07月 [査読有り][通常論文]
  • Cross-Lingual Analysis of Concerns and Reports on Crimes
    Proceedings of the Workshop on Mining User-Generated Content for Security 9  2009年 [査読有り][通常論文]
  • NSContrast: Characterizing the Difference of Interest among Multiple News Sites
    INTERACT 2009 Workshop on Culture and Technologies for Social Interaction http://sites.google.com/site/crosscultureworkshopinteract09/position-papers-1/10-Yoshioka.pdf-29  2009年 [査読有り][通常論文]
  • 鳥澤 健太郎, 中川 裕志, 黒橋 禎夫, 乾 健太郎, 吉岡 真治, 藤井 敦, 喜連川 優
    情報処理 49 8 890 - 896 一般社団法人情報処理学会 2008年08月15日 [査読無し][通常論文]
  • Kiyotaka Takahashi, Aki Sugiyama, Yoshiki Shimomura, Takeshi Tateyama, Ryosuke Chiba, Masaharu Yoshioka, Hideaki Takeda
    Proceedings of the 10th International Conference on Information Integration and Web-based Applications and Services, iiWAS 2008 575 - 578 2008年 [査読有り][通常論文]
     
    Recently, designers have been required solving comprehensive problem becoming greater and more complicated. In relation to this background, we have proposed Universal Abduction Studio (UAS) a computer environment that synthetically supports creative design. However, it is difficult for a designer to manually acquire multiple domain knowledge required for UAS. Therefore, we propose a Web-based knowledge database construction method for supporting design by UAS in this paper. © 2008 ACM.
  • Jaehui Park, Tomohiro Fukuhara, Ikki Ohmukai, Hideaki Takeda, Sang-Goo Lee
    International Conference on Information and Knowledge Management, Proceedings 103 - 110 2008年 [査読有り][通常論文]
     
    An increasing number of Web applications are allowing users to play more active roles for enriching the source content. The enriched data can be used for various applications such as text summarization, opinion mining and ontology creation. In this paper, we propose a novel Web content summarization method that creates a text summary by exploiting user feedback (comments and tags) in a social bookmarking service. We had manually analyzed user feedback in several representative social services including del.icio.us, Digg, YouTube, and Amazon.com. We found that (1) user comments in each social service have its own characteristics with respect to summarization, and (2) a tag frequency rank does not necessarily represent its usefulness for summarization. Based on these observations, we conjecture that user feedback in social bookmarking services is more suitable for summarization than other type of social services. We implemented prototype system called SSNote that analyzes tags and user comments in del.icio.us, and extracts summaries. Performance evaluations of the system were conducted by comparing its output summary with manual summaries generated by human evaluators. Experimental results show that our approach highlights the potential benefits of user feedback in social bookmarking services. Copyright 2008 ACM.
  • IR Interface for Contrasting Multiple News Sites
    Masaharu Yoshioka
    Proceedings of the Asia Information Retrieval Symposium 2008 - - 516 - 521 2008年01月 [査読有り][通常論文]
  • Masaharu Yoshioka
    SITIS 2008: 4TH INTERNATIONAL CONFERENCE ON SIGNAL IMAGE TECHNOLOGY AND INTERNET BASED SYSTEMS, PROCEEDINGS 45 - 51 2008年 [査読有り][通常論文]
     
    Today, there is access to large numbers of news sites in different countries, and there are several experimental systems, such as Newsblaster and NewsExplorer that integrate news articles about a particular event from multiple news sites. These systems enable a good understanding of particular events by using multiple news sites, but they ignore the characteristics of the various news sites. To characterize the differences between news sites, the News Site Contrast (NSContrast) system has been proposed. This system analyzes multiple news sites using the concept of contrast-set mining. However NSContrast has only limited analysis functions and is not mature enough for evaluation via user experiments. Therefore, in this paper, we analyze contrast set mining results for NSContrast, aiming to understand the requirements for extracting useful information that also reflects the interests of different countries. Based on this analysis, a new NSContrast is introduced and applied to a news article database constructed from multiple news sites in different countries for user experimentation.
  • Kiyotaka Takahashi, Aki Sugiyama, Yoshiki Shimomura, Takeshi Tateyama, Ryosuke Chiba, Masaharu Yoshioka, Hideaki Takeda
    PRACTICAL ASPECTS OF KNOWLEDGE MANAGEMENT, PROCEEDINGS 5345 173 - + 2008年 [査読有り][通常論文]
     
    In recent years, comprehensive problem solving by artefact designers has been required as demands related to artefacts become greater and more complicated. In relation to this background, we have proposed Universal Abduction Studio (UAS), a computer environment that synthetically supports a creative design. However, in general, it is difficult for a designer to acquire multiple domain knowledge because this knowledge is accumulated manually. This paper proposes a Web-based knowledge database construction method for supporting design using UAS.
  • 吉岡真治
    ヒューマンインタフェース学会誌 9 4 269-274  2007年11月 [査読無し][招待有り]
  • 武田 英明, 下村 芳樹, 吉岡 真治
    設計工学 = JOURNAL OF JAPAN SOCIETY FOR DESIGN ENGINEERING 42 10 558 - 564 日本設計工学会 2007年10月05日 [査読無し][通常論文]
  • Hideaki Takeda, Yutaka Fujimoto, Masaharu Yoshioka, Yoshiki Shimomuraz, Kengo Morimoto, Wataru Oniki
    NEW FRONTIERS IN ARTIFICIAL INTELLIGENCE 3609 - 216 - + 2007年 [査読有り][通常論文]
     
    This paper describes how to add tags to design documents in order to extract knowledge from information for intelligent design support. Our project called Universal Abduction Studio (UAS) aims to build a new design support system that supports conceptual design by dynamically integrating knowledge in different design domains. This paper focuses on knowledge description form which can be used to capture knowledge from text-based information and then be used for inference for creative design. We propose so-called design knowledge document containing both human-readable texts and machine-readable knowledge such as propositions and rules.
  • Masaharu Yoshioka
    INFORMATION RETRIEVAL TECHNOLOGY, PROCEEDINGS 4182 390 - 403 2006年 [査読有り][通常論文]
     
    Query term expansion is an important technique for achieving higher retrieval performance. However, since many factors affects the quality of this technique, it is difficult to evaluate this technique in isolation. Feature quantities that characterize the quality of the initial query are defined in this study for evaluating topic difficulties from the viewpoint of query term expansion. I also briefly review the result of the NTCIR-5 query term expansion subtask that uses these quantities for evaluating the effectiveness of the query term expansion techniques. I also describe detailed analysis results on the effect of query term expansion based on topic-by-topic analysis.
  • 下村 芳樹, 吉岡 真治, 武田 英明, 冨山 哲男
    日本機械学会論文集 C編 72 713 274 - 281 一般社団法人 日本機械学会 2006年 [査読無し][通常論文]
     
    This paper describes a new design support system that supports conceptual or creative design by dynamically integrating knowledge in different design domains. We argue that abduction for integrating theories can be a basic principle to formalize such design processes. Based on this principle, we propose Universal Abduction Studio, a design environment in which designers combine different theories to arrive at better design. In this new approach to computational support of conceptual design, the system should offer various types of abductive reasoning from which designers can select an interesting design method. We also discuss technologies to implement UAS and in this paper we propose to use analogical reasoning as abductive reasoning to discover relationships between knowledge from different sources. We demonstrate that a prototype system can discover a new idea in a design example taken from a real design activity.
  • 吉岡 真治, 原口 誠
    人工知能学会論文誌 = Transactions of the Japanese Society for Artificial Intelligence : AI 20 4 270 - 280 一般社団法人 人工知能学会 2005年11月01日 [査読無し][通常論文]
     
    It is not easy for a user of an Information Retrieval (IR) system to select an appropriate keyword set to represent his or her specific information need. Therefore, many IR systems can modify keyword sets by estimating the user's particular requirement. Even though such IR systems have better retrieval performance, the complicated estimation process entailed by a large number of keywords makes it difficult for a user to understand how the system behaves. Therefore, we used a thesaurus for query expansion. To select an appropriate keyword set, we proposed two concepts: ``adaptive generalization'', which estimates an appropriate generalization level of the given keywords by using relevant document information, and ``purpose-oriented concept structure modification'', which selects relevant keywords from a predefined synonym set in a thesaurus. Because query expansion based on a thesaurus aims to find new keywords that are complementary to the initial keywords, we proposed to use this method to construct a Boolean query formula to represent the user's information need. We proposed a new IR system called ``appropriate Boolean query reformulation for IR with adaptive generalization'' (ABRIR-AG) to support Boolean query formation. In ABRIR-AG, we reformulated a user-given Boolean query by using a small number of relevant documents. Finally, to evaluate its effectiveness, we evaluated ABRIR-AG by using a large-scale test collection containing WWW documents.
  • An Architecture for Designers' Support Systems with Knowledge-embedded Documents
    Proceedings of the 15th International Conference on Engineering Design -ICED05- (CD-ROM) 2005年 [査読無し][通常論文]
  • M Yoshioka, M Haraguchi
    International Workshop on Challenges in Web Information Retrieval and Integration, Proceedings 145 - 150 2005年 [査読有り][通常論文]
     
    When implementing an IR system that can support comprehensive searches from a wide variety of documents, it is crucial to have a mechanism for selecting appropriate query formulations. For this purpose, many IR systems can modify query terms by estimating the user's information need. However because modified query terms are usually represented in a complicated form, it is difficult to judge how appropriate they are. In this research, we assume all relevant documents should contain words that correspond to concepts that the user would like to retrieve. Therefore, a Boolean query formula is one good way to represent a user's information need with high readability. To find the required concepts in a relevant document set, we have previously proposed a new IR system that calculates appropriate generalized concepts to represent the user's need. In this study, we implement a user interface that supports reformulation of IR queries by using abstract concepts.
  • Masaharu Yoshioka, Makoto Haraguchi
    ACM Transactions on Asian Language Information Processing 4 3 340 - 356 2005年 [査読有り][通常論文]
     
    Even though a Boolean query can express the information need precisely enough to select relevant documents, it is not easy to construct an appropriate Boolean query that covers all relevant documents. To utilize a Boolean query effectively, a mechanism to retrieve as many as possible relevant documents is therefore required. In accordance with this requirement, we propose a method for modifying a given Boolean query by using information from a relevant document set. The retrieval results, however, may deteriorate if some important query terms are removed by this reformulation. A further mechanism is thus required in order to use other query terms that are useful for finding more relevant documents, but are not strictly required in relevant documents. To meet this requirement, we propose a new method that combines the probabilistic IR and the Boolean IR models. We also introduce a new IR system - called appropriate Boolean query reformulation for information retrieval (ABRIR) - based on these two methods and the Okapi system. ABRIR uses both a word index and a phrase index formed from combinations of two adjacent noun words. The effectiveness of these two methods was confirmed according to the NTCIR-4 Web test collection. © 2005 ACM.
  • M Yoshioka
    INFORMATION RETRIEVAL TECHNOLOGY, PROCEEDINGS 3689 647 - 652 2005年 [査読有り][通常論文]
     
    Query expansion is an important technique for achieving higher retrieval performance. However, a good framework for evaluating this technique in isolation does not, exist because the effect of query expansion depends on the quality of the initial query. Feature quantities that characterize the quality of the initial query are defined in this study. Correlations between these quantities and retrieval performance were analyzed using the NTCIR-4 web test collection.
  • M Yoshioka, Y Umeda, H Takeda, Y Shimomura, Y Nomaguchi, T Tomiyama
    ADVANCED ENGINEERING INFORMATICS 18 2 95 - 113 2004年04月 [査読有り][通常論文]
     
    Knowledge intensive engineering aims at flexible applications of a variety of product life cycle knowledge. much as design, manufacturing. operations, maintenance, and recycling. Many engineering domain theories are organized and embedded within CAD and CAE tools and engineering activities can be formalized as modeling operations to them. Since most of domain theories deal with the physical world and can be associated with physical concepts. a physical concept ontology can form a common ontology to integrate engineering models that are formed based on domain theories. This paper reports a physical ontology-based support system for knowledge intensive engineering called Knowledge intensive Engineering Framework (KIEF) to integrate multiple engineering models and to allow more flexible use of them. First the paper describes the physical ontology as the core of KIEF and an ontology-based reasoning system called a pluggable metamodel mechanism, to integrate and maintain relationships among these models. The pluggable metamodel mechanism uses a metamodel that represents the designer's mental model about a design object as a concept network model. The designer builds and decomposes a functional hierarchy from functional specifications with an FBS (Function-Behavior-State) modeler. He/She then maps the functional hierarchy into a metamodel using physical features that are building blocks for conceptual design. Then, the pluggable metamodel mechanism enriches the information contained in the metamodel by using causal dependency knowledge about the physical world and by budding and analzing various engineering models. We demonstrate the power of KIEF by illustrating a design case performed on KIEF. (C) 2004 Published by Elsevier Ltd.
  • M Yoshioka, M Haraguchi
    8TH WORLD MULTI-CONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL I, PROCEEDINGS I 226 - 230 2004年 [査読無し][通常論文]
     
    We can use various types of information retrieval (IR) system to access large quantities of text data. These systems usually request users to input keywords to represent their retrieval intention. Since, it is difficult for a user to select appropriate keywords, many IR systems have the capability of modifying keywords by estimating the user's intention. However because modified keywords are usually represented in a complicated form, it is difficult to judge how appropriate they are. In this research, we assume all relevant documents should have words that correspond to concepts that the user would like to retrieve. Therefore, a boolean query formula is one good way to represent user's intent with higher readability. In order to find out these concepts in a relevant document set, we have already proposed a new IR system that calculates appropriate generalized concept to represent user's intention. In this study, we implement a user interface that supports to clarify IR query by using abstract concepts.
  • M Yoshioka, M Haraguchi, A Mizoe
    INTUITIVE HUMAN INTERFACES FOR ORGANIZING AND ACCESSING INTELLECTUAL ASSETS 3359 243 - 255 2004年 [査読有り][通常論文]
     
    In order to construct story databases, it is crucial to have an effective index that represents the plot and event sequences in a document. For this purpose, we have already proposed a method using the concept of maximal analogy to represent a generalized event sequence of documents with a maximal set of events. However, it is expensive to calculate a maximal analogy from documents with a large number of sentences. Therefore, in this paper, we propose an efficient algorithm to generate a maximal analogy, based on graph theory, and we confirm its effectiveness experimentally. We also discuss how to use a maximal analogy as an index for a story database, and outline our future plans.
  • Universal abduction studio -- proposal of a design support environment for creative thinking in design --
    Hideaki Takeda, Hiromitsu Sakai, Yutaka Nomaguchi, Masaharu Yoshioka, Yoshiki Shimomura, Tetsuo Tomiyama
    A. Folkman, K. Gralen, M. Norell, and U. Sellgren, editors, The Fourteenth International Conference on Engineering Design (ICED 03), Stockholm, August 2003 2003年08月 [査読有り][通常論文]
  • Construction of Personalized and Purpose-Oriented Thesaurus
    Proceedings of Asian Association for Lexicography '03 (ASIALEX) 461 - 466 2003年 [査読無し][通常論文]
  • M Haraguchi, M Yotsutani, M Yoshioka
    7TH WORLD MULTICONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL V, PROCEEDINGS V 213 - 216 2003年 [査読無し][通常論文]
     
    To classify a document set from various viewpoints, we extract a possible abstract document from given similar documents. The abstract one is a common generalization of the original documents. Although we can present an efficient algorithm to find it under some pruning rule, it is generally very hard to perform such a task of extracting abstract documents. It is therefore necessary to reduce the numbers of events appearing in documents. For this purpose, we regard one document as a network of events, present a pseudo-PageRank model for calculating the importance of events, analyze and compare it with a standard text summarization method, and finally reports the present approach to improve the pseudo-PageRank.
  • Knowledge Management System for Problem Solving - Integration of Document Information and Formalized Knowledge -
    Proceedings of the 2003 ASME Design Engineering Technical Conference & Computers and Information in Engineering Conference (CD-ROM) DETC2003/CIE-48217  2003年 [査読無し][通常論文]
  • Abduction for Creative Design
    Computational Synthesis: From Basic Building Blocks to High Level Functionallity Papers from the 2003 AAAI Symposium 239 - 246 2003年 [査読無し][通常論文]
  • Tetsuo Tomiyama, Hideaki Takeda, Masaharu Yoshioka, Yoshiki Shimomura
    Proceedings of the ASME Design Engineering Technical Conference 3 543 - 552 2003年 [査読有り][通常論文]
     
    While abduction is considered crucial for design in general, this paper focuses on the role of abduction to integrate knowledge assuming that creative design can come from innovative combination of existing knowledge. Based on Schurz's classification of abductive reasoning, the paper identifies that abduction for integrating theories can be performed by a special type of abduction called second order existential abduction. The paper then analyzes refrigerator design cases to understand how knowledge is used and shows that abduction is indeed central to design. It also discusses that knowledge structure is a key concept in abduction for integration.
  • Oyama,K, Kageura, K, Kando, N, Kimura, M, Maruyama, K, Yoshioka, M, Takahashi, K
    Systems and Comupters in Japan 34 6 44 - 56 2003年01月 [査読有り][通常論文]
  • 竹内 孔一, 内山 清子, 吉岡 真治, 影浦峡, 小山 照夫
    情報処理学会論文誌 43 5 1446 - 1456 一般社団法人情報処理学会 2002年05月15日 [査読無し][通常論文]
     
    本研究では,主辞がサ変名詞である複合名詞の語構成において,構成する単語間の係り関係を支配する語彙的性質に着目し,それに基づく複合名詞解析モデルの作成を試みる.主辞がサ変名詞の複合名詞内の係り関係の解析は,並列関係の場合を除くと,主辞であるサ変名詞の項関係なのか修飾なのかを同定することが解析の第1歩である.項関係とは名詞が動詞の目的語や主語といった関係であることを意味している.本論文では,この関係をとらえる方法として,語彙概念構造を利用した動詞の分類と,その構造を利用した名詞の分類に基づく複合名詞解析手法を提案する.情報処理関連の専門用語と新聞記事中の一般的な複合名詞に対してテスト的な実験を行った.その結果,平均で1231語の複合名詞対して約99.4%の複合名詞を正しく解析する結果を得た.In this paper,we describe a principled approach for analyzing relations between constituent words of compound nouns,specifically those whose heads are deverbal nouns,based on the classification of deverbal nouns by their lexical conceptual structure (LCS) and the classification of nouns in modifier position vis-a-vis LCS of head deverbal nouns.There are two kinds of relations of compounds with head deverbal nouns.The one is that a modifier noun becomes an argument of deverbal head and the other is that a modifier becomes an adjunct.It is an important starting point for analyzing relations to disambiguate the two kinds of relations.Through the qualitative analysis of the data and the experimental evaluation of 1231 compound nouns, we show that the use of LCS as the theoretical basis is very promising for constructing compound analyzer.
  • 小川 泰嗣, 佐々木 裕, 増山 繁, 村田 真樹, 吉岡 真治, Yasushi Ogawa, Yutaka Sasaki, Shigeru Masuyama, Masaki Murata, Masaharu Yoshioka
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 17 3 306 - 311 人工知能学会 2002年05月01日 [査読無し][通常論文]
  • 人工物工学研究の展開 第18報 -Universal Abduction Studioの提案-
    坂井宏充, 野間口大, 吉岡真治, 武田英明, 下村芳樹, 冨山哲男
    日本機械学会第12回設計工学・システム部門講演会講演論文集 2002年04月 [査読無し][通常論文]
  • Document-based Design Process Knowledge Management for Knowledge Intensive Engineering
    Y. Nomaguchi, M. Yoshioka, T. Tomiyama
    From Knowledge Intensive CAD to Knowledge Intensive Engineering Kluwer Academic Publishers 2002年04月 [査読有り][通常論文]
  • 栗山 和子, 吉岡 真治, 神門 典子
    情報処理学会論文誌データベース(TOD) 43 2 48 - 59 一般社団法人情報処理学会 2002年03月15日 [査読無し][通常論文]
     
    大規模テストコレクションNTCIR-2 の正解文書リストは,NTCIR ワークショップ2 において各参加者から提出された検索結果を用いて,プーリング法に基づいて作成された.本稿では,NTCIR-2の正解文書リストの作成過程において行われた,言語横断的プーリング,および対話型検索システムを用いた追加検索が,検索システムのNTCIR-2 を用いた相対的評価にどのような影響を与えるかを考察する.また,プーリングに参加しなかったシステムを評価する場合に,プーリング法で作成したNTCIR-2 が有効であるかどうか調べる.本研究では,NTCIR-2 の正解文書リストと,NTCIR ワークショップ2 の参加チームの提出結果を用いて評価実験を行った.まず,最終的な正解文書リストFと,F から追加の対話型検索I だけで見つかった文書を除いた正解文書リストF ? I を用いて,提出結果の評価を行った.次に,各サブタスクごとの提出結果からプーリングを行い,このサブタスクごとのプールを正解文書リストとして用いた場合の評価を行った.さらに,プーリングに参加しなかったシステムの評価をシミュレートするため,F から同じシステムの提出結果の集合だけに含まれている正解文書S を除いた正解文書リストF ? S を用いて,そのシステムの提出結果を評価した.いずれの場合でも,提出結果の平均精度の平均による順位付けを行い,相対的評価とした.結果として,どの文書リストを正解文書リストとして用いて提出結果の評価を行っても,提出結果の相対的な順位はほとんど変化しなかった.また,そのシステムだけが見つけた正解文書を除いても,すなわち,そのシステムがプーリングに参加しなくても,そのシステムの提出結果の評価にはほとんど影響がなく,プーリングに参加した他システムとの相対的評価についても影響がないことが分かった.このことから,プーリング法に基づいて作成したテストコレクションの信頼性を確かめることができた.The purposes of this study are to examine whether there is an effect on the relative evalu- ation of the IR systems using the relevance judgments of the test collection NTCIR-2 made by the pooling method and additional interactive searches,and to investigate whether the NTCIR-2 is effective for evaluating the IR systems,the search results of which were not used for the pooling.We carried out experiments using different lists of relevance judgments and search results submitted for the test of the 2nd NTCIR Workshop. First,we evaluated the search results using the list of the ?nal relevance judgments F of NTCIR-2 and F 竏驤 I that is,the F without the unique relevant documents found by the additional interactive searches I Second,we made pools from the search results for each of the sub-tasks and evaluated the search results using the pools as lists of relevance judgments.Third,we evaluated the search results using F 竏驤 S that is,the F without the unique relevant documents found by an IR system S in order to simulate evaluation of the IR system which was not used for the pooling. Almost the same rankings of the search results were produced by using the pools as lists of relevance judgments for system evaluation.When the search results by an IR system were not used for the pooling,there is a very little effect on evaluation of the system itself and relative evaluation among it and other systems.Therefore our results veri ?ed the reliability of test collection as an evaluation tool,which was based on pooling method.
  • Yutaka Nomaguchi, Masaharu Yoshioka, Tetsuo Tomiyama
    人工知能学会誌 17 1 104 - 113 2002年 [査読無し][通常論文]
     
    In this paper, we propose a fundamental idea of a new CAD mechanism to facilitate design knowledge management. This mechanism encourages a designer to externalise his/her knowledge during a design process and facilitates sharing and reuse of such externalised design knowledge in later stages. We also describe the implementation of this idea called DDMS (Design Documentation Management System). DDMS works as a front end to KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the features of DDMS.
  • M Haraguchi, S Nakano, M Yoshioka
    DISCOVERY SCIENCE, PROCEEDINGS 2534 324 - 331 2002年 [査読無し][通常論文]
     
    Given two documents in the form of texts, we present a notion of maximal analogy representing a generalized event sequence of documents with a maximal set of events. They are intended to be used as extended indices of documents to automatically organize a document database from various viewpoints. The maximal analogy is defined so as to satisfy a certain consistency condition and a cost condition. Under the consistency condition, a term in an event sequence is generalized to more abstract term independently of its occurrence positions. The cost condition is introduced so that meaningless similarities between documents are never concluded. As the cost function is monotone, we can present an optimized bottom-up search procedure to discover a maximal analogy under an upper bound of cost. We also show some experimental results based on which we discuss a future plan.
  • Development of design for upgradable products considering future uncertainty
    Proceedings of CARE Innovation 2002 (CD-ROM) 2002年 [査読無し][通常論文]
  • A Knowledge Operation model of Synthesis
    TOMIYAMA Tetsuo, YOSHIOKA Masaharu, TSUMAYA Akira
    Engineering Design Synthesis - Understanding, Approaches, and Tools, Springer-Verlag pp.67-90 2002年01月 [査読無し][通常論文]
  • 野間口大, 吉岡真治, 冨山哲男
    人工知能学会論文誌 17 104 - 113 社団法人 人工知能学会 2002年 [査読有り][通常論文]
     
    In this paper, we propose a fundamental idea of a new CAD mechanism to facilitate design knowledge management. This mechanism encourages a designer to externalise his/her knowledge during a design process and facilitates sharing and reuse of such externalised design knowledge in later stages. We also describe the implementation of this idea called DDMS (Design Documentation Management System). DDMS works as a front end to KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the features of DDMS.
  • 吉岡 真治, 冨山 哲男
    精密工学会誌 = Journal of the Japan Society of Precision Engineering 67 9 1490 - 1496 公益社団法人精密工学会 2001年09月05日 [査読無し][通常論文]
     
    In a design process, a designer uses various kinds of design object knowledge, such as physical laws, mechanism library, and manufacturing knowledge. Therefore, it is necessary for a CAD system to handle large scale knowledge bases to support this process. However, it is difficult to use a large scale knowledge base without knowledge about operations of the knowledge itself. This paper proposes a theory of design knowledge operations. First, we analyze the results of design experiments that are records of real design processes. Second, we formalize design knowledge operations based on General Design Theory. Finally we discuss the generality of the proposed formalism of design knowledge operations.
  • 内山 清子, 竹内 孔一, 吉岡 真治
    計量国語学 23 1 1 - 24 計量国語学会 2001年06月 [査読無し][通常論文]
  • A Model of Synthesis: A System of Multiple Theories
    TOMIYAMA Tetsuo, HEW Ken P, MURAKAMI Tamotsu, YOSHIOKA Masaharu, TAKEDA Hideaki, WASHIO Takeshi, TSUMAYA Akira, UMEDA Yasushi
    Proceedings of the International CIRP Design Seminar 2001 pp.1-6 2001年06月 [査読有り][通常論文]
  • 大山 敬三, 影浦 峡, 神門 典子, 木村 優, 丸山 勝巳, 吉岡 真治, 高橋 一道
    電子情報通信学会論文誌. D-1, 情報・システム 1-情報処理 84 6 658 - 670 一般社団法人電子情報通信学会 2001年06月01日 [査読無し][通常論文]
     
    インターネットの発展に伴い, WWWを介した本格的な情報検索サービスの堤供が求められているが, 既存のWWW情報検索システムでは, 検索機能やデータベースの構造・規模などに制約が多い.本論文の情報検索システムは実際の情報検索サービスで運用されているものであり, 大規模で複雑な構造をもつテキスト型の学術情報データベースに対し, 高度な検索機能を, ラインモードとWWWインタフェースにより提供している.本論文では, まず情報検索機能の概要と設計について, 特に集合演算, シソーラス検索, 階層構造検索, 複数データベースの統合検索などの特徴的な機能について述べている.次に, その実現のための実装技術として, 検索エンジンの特長, セッション管理方式, 大規模データベースの扱い, サーバ及びプロセスの構成などを示し, 現状のシステムについての運用上の評価を行い, 最後に今後の課題と関連研究について議論している.
  • 設計シミュレータを用いた設計文書作成支援
    野間口大, 冨山哲男, 吉岡真治
    2001年度精密工学会春季大会学術講演会講演論文集 2001年04月 [査読無し][通常論文]
  • Proposal of an Integrated Design Support Environment Based on the Model of Synthesis
    Proceeding of the 2001 ASME Design Engineering Technical Conference & Computers and Information in Engineering Conference (CD-ROM) DETC2001/DAC-21155  2001年 [査読無し][通常論文]
  • H Takeda, M Yoshioka, T Tomiyama
    DESIGN RESEARCH - THEORIES, METHODOLOGIES, AND PRODUCT MODELLING 307 - 314 2001年 [査読無し][通常論文]
  • Y Umemori, S Kondoh, Y Umeda, Y Shimomura, M Yoshioka
    SECOND INTERNATIONAL SYMPOSIUM ON ENVIRONMENTALLY CONSCIOUS DESIGN AND INVERSE MANUFACTURING, PROCEEDINGS 87 - 92 2001年 [査読無し][通常論文]
     
    Conventional products tend to be thrown away because of functional obsoleteness before reaching the end of physical life of the products, This is one of the main causes of the mass disposal problem. In order to solve this problem, this paper proposes a design methodology for upgradable products, Especially, this paper discusses a method dealing with uncertainty caused by long-term planning in the design methodology for upgradability Namely, the proposed method deals with uncertainty as ranges of parameter values, and derives a design solution that realizes required upgrades, while adapting to estimated uncertainty. This method makes the products robust and tolerant against the uncertainty and, therefore, makes design for upgradability more feasible.
  • A Tsumaya, Y Nomaguchi, M Yoshioka, H Takeda, T Murakami, T Tomiyama
    DESIGN RESEARCH - THEORIES, METHODOLOGIES, AND PRODUCT MODELLING 229 - 236 2001年 [査読無し][通常論文]
  • A Model of Synthesis from the Viewpoint of Design Knowledge Operations
    TOMIYAMA Tetsuo, YOSHIOKA Masaharu, TSUMAYA Akira
    Proceedings of the 1st International Conference on Mechanocal Engineering (ICME2000) CD-ROM (6 pages) 2000年11月 [査読有り][通常論文]
  • IR/IE/Summarisation Evaluation Projects in Japan
    Kageura,K, Fukushima, T, Kando, N, Okumura, M, Sekine, S, Kuriyama, K, Takeuchi, K, Yoshioka, M, Koyama, T, Isahara, H
    Proceedings of LREC 2000 Workshop on Using Evaluation within HLT Programs, Athens, Greece, May, 2000 19 - 22 2000年05月 [査読有り][通常論文]
  • 木村 優, 吉岡 真治, 神門 典子, 影浦 峡, 大山 敬三
    情報の科学と技術 50 1 30 - 36 一般社団法人 情報科学技術協会 2000年 [査読無し][通常論文]
     
    学術情報センターの情報検索サービスNACSIS-IRにおける検索システム及び検索インタフェースの移行について述べる。センターでは,1987年から汎用機を利用した情報検索サービスを行ってきたが,平成12年1月からオープンシステムに全面的に移行し,全文検索機能による検索システムを提供する。新しい情報検索システムでのデ一タベースの構造,全文検索に対応する検索機能及びWWWを用いた検索インタフェース等について報告する。
  • 関谷 貴之, 吉岡 真治, 冨山 哲男, Takayuki Sekiya, Masaharu Yoshioka, Tetsuo Tomiyama
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 14 6 1051 - 1060 人工知能学会 1999年11月01日 [査読無し][通常論文]
     
    During design, a designer uses various computational tools, such as a geometric modeling system, analysis tools, and databases. To support these design processes, a system that can integrate such computational tools is required. For this purpose, we have been developing the Knowledge Intensive Engineering Framework (KIEF) system. KIEF enables the designer to build, evaluate, and modify design models on the system by providing him/her with a wide variety of engineering knowledge. A common ontology plays an important role in integrating tools and representing engineering knowledge. This paper describes the structure of the ontology in KIEF, and how it is used in a modeling processes on KIEF.
  • Knowledge Acquisition by Documenting Design for the Knowledge Intensive Engineering Framework
    Nomaguchi, Y, Yoshioka, M, Tomiyama, T
    Proceedings of the 1999 Lancaster International Workshop on Engineering Design 1999年05月 [査読有り][通常論文]
  • 設計文書からの知識の構造化の手法の提案
    野間口大, 吉岡真治, 冨山哲男
    日本機械学会第9回設計工学・システム部門講演会論文集 1999年04月 [査読無し][通常論文]
  • Koichi Takeuchi, Masaharu Yoshioka, Teruo Koyama, Kyo Kageura
    Proceedings of the First NTCIR Workshop on Research in Japanese Text Retrieval and Term Recognition, NTCIR-1, Tokyo, Japan, August 30 - September 1, 1999 National Center for Science Information Systems (NACSIS) 1999年 [査読有り][通常論文]
  • 設計知識に注目した設計の推論モデルの提案(第2報) --設計行為に関する知識の提案--
    武田英明, 吉岡真治, 冨山哲男
    日本機械学会 第9回 設計工学・システム部門講演会 82 - 85 1999年01月 [査読無し][通常論文]
  • Phrase processing methods for Japanese text retrieval
    Kando, N, Kageura, K, Yoshioka, M, Oyama, K
    Proceedings of ACM-SIGIR Workshop on Information Retrieval: Theory into Practice. August 28, 1998, Melbourne, Australia 13 - 19 1998年08月28日 [査読有り][通常論文]
  • 吉岡 真治, 冨山 哲男, Masaharu Yoshioka, Tetsuo Tomiyama
    人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 13 2 312 - 319 人工知能学会 1998年03月01日 [査読無し][通常論文]
     
    In this study, we propose a framework of an integrated modeling environment for design. Since a mechanical engineering design process requires various kinds of design object models, such as a geometric model, a kinematic model, and a finite element model, this environment should maintain consistency among these models. Furthermore, commercial design tools are practically used in design processes, and these must be integrated as well. For dealing with multiple design object models, we have formalized a concept called a metamodel. A metamodel is a model which represents relationships among concepts used in various design object models. This paper proposes a framework of the pluggable metamodel mechanism that allows to plug in existing design tools, to support a modeling on it, and to maintain consistency among them. We describe a prototype system and illustrate an example of ball screw design.
  • Noriko Kando, Kyo Kageura, Masaharu Yoshioka, Keizo Oyama
    SIGIR Forum (ACM Special Interest Group on Information Retrieval) 32 2 23 - 28 1998年 [査読有り][通常論文]
     
    This paper examines the effectiveness of different phrase identification and weighting methods for Japanese text retrieval in an operational information retrieval (IR) system, called NACSIS-IR. Based on our previous experiments, we used character-based indexing with positional information and word-or phrase-based query processing, which allowed us to implement sophisticated linguistic analysis on large-scale databases while maintaining adequate efficiency. The results of retrieval experiments on a large-scale Japanese test collection showed that the combination of enhanced phrase identification using patterns defined over part-of-speech tags and our algorithms Phrase2 and Phrase5 made a significant positive contribution to retrieval effectiveness. The paper also discusses indexing and phrase processing of Japanese or East Asian languages.
  • Representation of design object based on functional evolution process model
    Yoshiki Shimomura, Masaharu Yoshioka, Hideaki Takeda, Yasushi Umeda, Tetsuo Tomiyama
    Journal of Mechanical Design 120 2 221 - 229 1998年01月 [査読有り][通常論文]
  • NTCIR : NACSIS Test Collection Project
    Noriko Kando, Teruo Koyama, Keizo Oyama, Kyo Kageura, Masaharu Yoshioka
    Proceedings of the 20th Annual Colloquium of BCS-IRSG 1997年01月 [査読有り][通常論文]
  • The modeling of synthesis -from the viewpoint of design knowledge
    T. Tomiyama, T. Murakami, T. Washio, A. Kubota, H. Takeda, T. Kiriyama, Y. Umeda, M. Yoshioka
    WDK 25, Proceedings of the 11th International Conference on Engineering Design in Tampere 199, Tampere, Finland, 1997. 3 97 - 100 1997年01月 [査読有り][通常論文]
  • 吉岡真治, 中村雅彦, 冨山哲男, 吉川弘之
    日本機械学會論文集. C編 61 581 330 - 337 社団法人日本機械学会 1995年12月 [査読有り][通常論文]
     
    An intelligent CAD system aims at serving a designer as an intelligent, integrated design environment. For building such a system, development of a large scale knowledge base is necessary. To do so, design knowledge must be systematically formalized, made computable, and organized. Design knowledge has two categories ; i.e., design object knowledge and design process knowledge. In our previous reports, we have formalized a computable design process model to represent design process knowledge and the concept of a metamodel dealing with multiple design object models. This paper proposes a fra...
  • Yoshiki Shimomura, Hideaki Takeda, Masaharu Yoshioka, Yasushi Umeda, Tetsuo Tomiyama
    American Society of Mechanical Engineers, Design Engineering Division (Publication) DE 83 2 Pt 1 351 - 360 1995年 [査読有り][通常論文]
     
    An extension of the Function-Behavior-State (FBS) diagram is proposed for representing a function in the computer aided conceptual design process. The new FBS method uses three additional concepts, namely: function body, function modifier and object entity, to represent the designers' intention more precisely than the original FBS diagram. The performance of the proposed method is complemented by the Functional Evolution Process (FEP) model which represents the different design processes.
  • 多重世界を用いた設計過程の論理による形式化
    武田英明, 吉岡真治, 冨山哲男, 吉川弘之
    1991年度人工知能学会(第5回)論文集, 学習院大学、東京, 1991. 1991年6月28日 1991年06月28日 [査読無し][通常論文]
  • 多重世界を用いた設計過程のシミュレーション
    吉岡真治, 河合浩之, 武田英明, 冨山哲男, 吉川弘之
    1991年度精密工学会春季大会講演論文集, 早稲田大学、東京, 1991. 1991年3月26日発表 1991年03月26日 [査読無し][通常論文]

講演・口頭発表等

  • Knowledge exploratory project for nanocrystal device development  [招待講演]
    Masaharu YOSHIOKA
    ISMAC 2016 2016 International Symposium on Multimedia and Communication Technology 2016年09月 口頭発表(基調)
  • Supporting design and engineering by physical concept ontologies  [招待講演]
    吉岡真治
    The Tenth International Symposium on Tools and Methods of Competitive Engineering (TMCE 2014) 2014年05月 シンポジウム・ワークショップパネル(指名)

その他活動・業績

  • 高橋 翔哉, 吉岡 真治 人工知能基本問題研究会 112 42 -47 2020年03月08日 [査読無し][通常論文]
  • 中野 裕太, 吉岡 真治 人工知能基本問題研究会 111 23 -28 2020年01月29日 [査読無し][通常論文]
  • 狩野 芳伸, 吉岡 真治, ラベロ ジュリアーノ, キム ミユン, ゴーベル ランディ, 佐藤 健 人工知能 35 (3) 377 -384 2020年 [査読無し][通常論文]
  • 中川 嵩教, 小板橋 佳晃, 吉岡 真治 人工知能学会全国大会論文集 2020 (0) 4H3GS405 -4H3GS405 2020年 [査読無し][通常論文]
     

    Wikipediaのカテゴリには、その属するページのクラス分類に有用な情報が含まれているため、このカテゴリ情報を用いたクラス分類の方法が提案されている。しかし、Wikipediaカテゴリには、様々なタイプの情報が混在しているため、同時に付与することが適切でないようなカテゴリをつけてしまうといった問題があった。本研究では、Wikipediaカテゴリのタイプやその親子関係についての定義を与えているWikipediaカテゴリオントロジーを用いることにより、複数のカテゴリを有するようなページに対して、より適切なクラスを推定し分類する方法を提案する。この手法を用いることにより、複数のカテゴリに属するページのクラスの適切性を順位づけることができた。また、本手法の有用性を日本語Wikipediaに対して同様の試みを行っている「森羅」の分類と比較し、その有効性を確認した。

  • 高丸 圭一, 木村 泰知, 内田 ゆず, 佐々木 稔, 吉岡 真治, 秋葉 友良, 渋木 英潔 人工知能学会全国大会論文集 2020 (0) 4Q3GS901 -4Q3GS901 2020年 [査読無し][通常論文]
     

    筆者らは評価型タスクNTCIR-15 QA Lab-PoliInfo-2において東京都議会会議録を対象として、議会における議員の発言から、議員が所属する会派の各議案への賛否を推定するStance Classification Taskを企画している。 例えば会議録「受動喫煙防止は、我が都議会自民党の公約であり、私自身も、ぜひ積極的に進めていただきたいと心から願う一人です。しかしながら、そのことと、今回提出された条例案がよいものかというのは別の話であり、残念ながら、この条例には問題が多く、賛成できないというのが、我が党の考えです。」という発言から「都議会自民党」は提出された議案へ「反対」を表明していることが分かる。本稿では、Stance Classification Taskの正解データの構築に向けて、議案への賛否を表明する発言の分析結果について述べる。

  • 古川 慧, 吉岡 真治 人工知能学会全国大会論文集 2020 (0) 3Rin470 -3Rin470 2020年 [査読無し][通常論文]
     

    近年、様々な業種の企業において、技術の標準化や技術継承を目的として、多くの社内技術文書が作成され蓄積されている。これらの社内技術文書には、一定のフォーマットが与えられ、文書検索システムによって検索可能な形で共有されることが多い。しかし、これらの文書では、特定の分野に特化して記述された文書が多く、あらかじめ関係しそうな文書を知っている経験のある技術者にとっては、関連する文書を見つけるのに十分なシステムであるが、経験の浅い技術者にとっては、どのような文書が存在するのかが不明なだけでなく、適切な検索語を見つけないと関係する文書があってもうまく見つけられないといった問題点がある。 本研究では、著者の一人が所属する建設会社における社内文書群を例として、上記問題点に関する予備調査を行うと共に、建築施工段階や建築条件を考慮した技術文書の検索支援システムについての基本構想を紹介する。

  • 片寄 諒亮, 吉岡 真治 人工知能学会全国大会論文集 2020 (0) 3Rin412 -3Rin412 2020年 [査読無し][通常論文]
     

    近年、時系列データや金融指標を用いたテクニカル分析やファンダメンタル分析、さらにニュース情報を用いたテキスト分析など様々な形で株価の予測が行われている。我々は、テクニカル分析などを用いたアルゴリズム取引が増えていることを考慮し、複数のテクニカル指標を用いた機械学習による株価予測の手法を提案する。この際に、企業の決算発表やニュースリリースなどテクニカル分析以外の要因の影響を考慮し、テクニカル分析による当てはまりが良い銘柄、悪い銘柄などを分類した上で作成した学習・評価データを作成して評価を行うと共に、複数のテクニカル指標の組み合わせ方法について検討を行う。

  • 中川 嵩教, 小板橋 佳晃, 吉岡 真治 人工知能学会全国大会論文集 2019 (0) 1K2J405 -1K2J405 2019年 [査読無し][通常論文]
     

    Wikipediaカテゴリを分析する研究から、カテゴリには概念分類を表すものだけでなく、人名や組織名といったインスタンスを表すものやその組み合わせが存在しているために、知識工学的観点から利用するためには、そのカテゴリ間の関係について検討することが必要であることが提案された。また、この考え方に基づき、カテゴリの種類、カテゴリの親子関係の種類を整理したデータの構築を行った。本稿では、この構築したデータに基づき、特定の親子関係のみを利用して(あるいは、排除して)できあがるカテゴリ階層構造の性質を議論することで、これまでに提案してきたWikipediaカテゴリに関する分類の枠組の有用性について議論する。

  • 立浪紀彦, 吉岡真治 情報処理学会研究報告(Web) 2018 (ICS-192) Vol.2018‐ICS‐192,No.6,1‐4 (WEB ONLY) 2018年06月29日 [査読無し][通常論文]
  • Construction of In-House Papers/Figures Database System using PDFs
    M. Yoshioka, S. Hara Collected Abstract of the 12th International Workshop on Information Search, Integration, and Personalization (ISIP 2018), Fukuoka, Japan, May 14-15, 2018. 1 -1 2018年05月 [査読有り][通常論文]
  • 吉岡真治, 中川嵩教 言語処理学会年次大会発表論文集(Web) 24th ROMBUNNO.P12‐1 (WEB ONLY) 2018年 [査読無し][通常論文]
  • 中川 嵩教, 吉岡 真治 人工知能学会全国大会論文集 2018 (0) 2F402 -2F402 2018年 [査読無し][通常論文]
     

    Wikipediaは世界最大のインターネット百科事典であり、様々な形で知識源として活用する方法が検討されている。具体的には、各記事に関する属性情報(所在地、生年月日、所属…)などを記述したインフォボックスから属性情報を抽出するDBpediaの研究や、カテゴリの情報を用いて、様々な単語間の類似性を計算する方法や、オントロジーの構築に役立てるYAGO2や、日本語Wikipediaオントロジーの研究などが存在する。また、我々は、これまでに、このカテゴリの性質に関する分析を行っており、これらの研究の中で、Wikipediaのカテゴリの持つ特殊性を指摘し、その特殊性を考慮した利用方法が必要であることを提案してきた。 本研究では、これまでの研究踏まえて、Wikipediaのカテゴリ階層を概念階層として扱う場合の問題点を、具体例を示しながら指摘するとともに、その問題点を解消するための、知識工学的観点からのWikipediaカテゴリの再整理を行う方法を提案する。

  • Construction of In-House Papers/Figures Database System for a Paticular Research Domain using PDFs - Application of Nano-Crystal Device Development Domain -
    M. Yoshioka, S. Hara Proccedings of the 2nd International Workshop on Scientific Document Analysis (SCIDOCA 2017), Tokyo, Japan, November 14-15, 2017: Proccedings of the 2nd International Workshop on Scientific Document Analysis (7pp.) 1 -7 2017年11月 [査読有り][通常論文]
  • 小野寺大輝, 吉岡真治 言語処理学会年次大会発表論文集(Web) 23rd ROMBUNNO.C3‐4 (WEB ONLY) 2017年 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会全国大会論文集 2017 (0) 1E1OS24a3 -1E1OS24a3 2017年 [査読無し][通常論文]
     

    本試論では、自動運転の車のようなオープンな環境で利用される人工知能を搭載された人工物の製造物責任について検討する。オープンな環境における責任を議論するためには、様々な事態と付随するリスクを認識し、製造者と利用者が適切に分担する枠組が必要になると考えている。本論では、トロッコ問題を例にとり、製造者と利用者がリスクを適切に認識するための枠組とその実現のための人工知能の果たすべき役割について考察する。

  • 小野寺大輝, 吉岡真治 言語処理学会年次大会発表論文集(Web) 22nd P13‐5 (WEB ONLY) 2016年 [査読無し][通常論文]
  • 小野寺 大輝, 黄 楽, 吉岡 真治 人工知能学会全国大会論文集 2016 (0) 4B45 -4B45 2016年 [査読無し][通常論文]
  • ZHU Tao, DIEB Thaer M, 吉岡真治, 原真二郎 人工知能学会全国大会論文集(CD-ROM) 30th ROMBUNNO.1J2‐4 2016年 [査読無し][通常論文]
  • 朱 濤, Dieb Thaer Mostafa, 吉岡 真治, 原 真二郎 人工知能学会全国大会論文集 2016 (0) 1J24 -1J24 2016年 [査読無し][通常論文]
  • 吉岡 真治, Loban Rhett 人工知能学会全国大会論文集 29 1 -4 2015年 [査読無し][通常論文]
  • 吉岡 真治, Loban Rhett 人工知能学会全国大会論文集 2015 (0) 1G42 -1G42 2015年 [査読無し][通常論文]
     

    Web上の百科事典であるWikipediaは、様々な事象に関する知識源であるが、その情報の品質については、編集者に依存する。本研究では、DBPediaにより抽出された構造化情報を用いて、Wikipediaのカテゴリ構造の一貫性を分析する方法を提案するとともに、その分析事例について紹介する。

  • 岸桂太, 吉岡真治 研究報告情報基礎とアクセス技術(IFAT) 2014 (9) 1 -5 2014年03月22日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現から対象と観点を抽出し、それらを用いた特許マップの生成手法を提案する。
  • 岸桂太, 吉岡真治 情報処理学会研究報告. DD, [デジタル・ドキュメント] 2014 (9) 1 -5 2014年03月22日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現から対象と観点を抽出し、それらを用いた特許マップの生成手法を提案する。
  • 岸桂太, 吉岡真治 情報処理学会研究報告. 情報学基礎研究会報告 2014 (9) 1 -5 2014年03月22日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現から対象と観点を抽出し、それらを用いた特許マップの生成手法を提案する。
  • 吉岡 真治 人工知能学会全国大会論文集 28 1 -4 2014年 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会全国大会論文集 2014 (0) 2J34 -2J34 2014年 [査読無し][通常論文]
     

    Wikipediaのカテゴリーは、閲覧者にとって有用な分類を提供するものであり、そのカテゴリーは束状の階層関係として表現される。 この関係には、概念間の階層関係を含む様々な関係が存在する。 本発表では、このカテゴリー階層関係の特徴的なパターンを分析すると共に、その分析結果に基づいた日本語Wikipediaオントロジーに関する考察を行う。

  • 岸 桂太, 吉岡 真治 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113 (150) 55 -58 2013年07月22日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現を網羅的に集めるための手法を提案するとともに、効果とその対象に注目した特許マップの生成手法を提案する。
  • 岸桂太, 吉岡真治 情報処理学会研究報告. 情報学基礎研究会報告 2013 (10) 1 -4 2013年07月15日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現を網羅的に集めるための手法を提案するとともに、効果とその対象に注目した特許マップの生成手法を提案する。
  • 岸桂太, 吉岡真治 情報処理学会研究報告. データベース・システム研究会報告 2013 (10) 1 -4 2013年07月15日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現を網羅的に集めるための手法を提案するとともに、効果とその対象に注目した特許マップの生成手法を提案する。
  • 岸桂太, 吉岡真治 研究報告情報基礎とアクセス技術(IFAT) 2013 (10) 1 -4 2013年07月15日 [査読無し][通常論文]
     
    多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現を網羅的に集めるための手法を提案するとともに、効果とその対象に注目した特許マップの生成手法を提案する。
  • HU Shuo, 高橋佑介, ZHENG LiYi, 宇津呂武仁, 吉岡真治, 神門典子 言語処理学会年次大会発表論文集(Web) 19th WEB ONLY C3-1 2013年 [査読無し][通常論文]
  • ZHENG Liyi, HU Shuo, 小池大地, 宇津呂武仁, 吉岡真治, 神門典子 言語処理学会年次大会発表論文集(Web) 19th WEB ONLY C3-3 2013年 [査読無し][通常論文]
  • DIEB Thaer M, YOSHIOKA Masaharu, HARA Shinjiroh 人工知能学会全国大会論文集(CD-ROM) 27th ROMBUNNO.1C3-4 2013年 [査読無し][通常論文]
  • 小池 大地, 宇津呂 武仁, 河田 容英, 吉岡 真治 人工知能学会全国大会論文集 2013 (0) 2E14in -2E14in 2013年 [査読無し][通常論文]
     

    本論文では,検索エンジンAPIを用いたウェブページ収集タスクにおいて,ト ピックモデルを用いたトピックの分布の観点から,できる限り多様なウェブペー ジを収集する方式を提案する.提案方式によって,ニュース・ブログにおける トピックとの関連が強いウェブページを収集することにより,より多様性に富 んだトピックの分布が観測できることを示す.

  • Thaer Mostafa Dieb, 吉岡 真治, 原 真二郎 人工知能学会全国大会論文集 2013 (0) 1C34 -1C34 2013年 [査読無し][通常論文]
     

    We have been working on the project "Exploring knowledge for nanodevice development" and proposed a framework to annotate useful information (e.g., source material, evaluation parameter, and so on) for analyzing nanocrystal device development papers. In this paper, we conduct nanocrystal device research papers clustering experiment once on annotated papers using automatic annotation results, and once as non-annotated using bag of word approach, and then we compare the results discussing the usefulness of the automatic annotation.

  • 吉岡真治, 神門典子 情報アクセスシンポジウム2012 2012 (2012) 1 -7 2012年11月30日 [査読無し][通常論文]
  • 吉岡真治, THAER Moustafa Dieb, 原真二郎 Designシンポジウム講演論文集 2012 87 -91 2012年10月16日 [査読無し][通常論文]
  • 吉岡 真治, 劉 亦奇, 神門 典子 情報処理学会論文誌データベース(TOD) 5 (3) 141 -148 2012年09月28日 [査読無し][通常論文]
     
    近年,地理情報を扱う情報システムの増加にともない,地理情報に関するデータベースへのニーズが高まっている. GeoNames は, Open Data としては,最大規模の地理情報データベースである.本データベースを Linked Open Data として Wikipedia の情報を媒介として関連づけることにより, Web Ontology の開発などに役立てられている.ただし, GeoNames と Wikipedia の間のリンクについては,自動的なリンク発見の試みがいくつか行われているものの,十分な数のリンクが付与されている状態ではない.本論文では, Wikipedia のカテゴリ情報を使うことで,精度良く Wikipedia のページに対応する GeoNames のエントリを発見する方法を提案する.また,本手法は,既存のリンク中の不適切なリンクを発見する際にも利用可能であることを示す.本手法の成果については,すでに, GeoNames の管理者に報告しており,その成果の一部は, GeoNames 中のリンク情報として公開・修正が行われている.Recently, due to the higher demand for geographic information system, it is necessary to have a good geographical database for such systems. GeoNames is one of the largest geographical database as Open Data. This database is also used for constructing web ontology by adding links to the Wikipedia page as a part of Linked Open Data. Even though, here are several attempts to find links automatically, the number of links between GeoNames and Wikipedia is not sufficient. In this paper, we propose an automatic link discovery method to use Wikipedia categories to identify the correspondence between Wikipedia page and GeoNames entry. We also propose to use this method for inappropriate link detection. Link data obtained in this paper is already sent to the manager of GeoNames and a part of the result is used for updating the site.
  • 胡 碩, 鄭 立儀, 高橋 佑介, 小池 大地, 牧田 健作, 宇津呂 武仁, 吉岡 真治 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 112 (196) 25 -30 2012年08月23日 [査読無し][通常論文]
     
    本研究では,日本語および中国語の時系列ニュースおよびブログを対象として,教師なしの(時系列)トピックモデルを適用し,時系列のトピックの推移を推定することにより,二言語間あるいはニュース・ブログの間でのトピックの対応の有無,および,関心事項の差異を分析するアプローチをとる.特に,本論文では,日中時系列ニュースの間でトピック対応を同定する方式についてその詳細および評価結果を述べる.また,中国語において,多様なニュースサイトにおいてバーストするトピックを中心として,中国語ブログの収集を行い,中国語におけるニュースとブログの間での関心事項の違いや意見の有無について分析する.
  • 吉岡真治 研究報告データベースシステム(DBS) 2012 (1) 1 -5 2012年07月25日 [査読無し][通常論文]
     
    現在、Wikipedia の情報を中心に様々な Open Data を関連づけて活用する Linked Open Data の研究が行われている。本発表では、Wikipedia のページが表現する情報の粒度が与える影響について考察を行う。
  • 吉岡真治 研究報告情報基礎とアクセス技術(IFAT) 2012 (1) 1 -5 2012年07月25日 [査読無し][通常論文]
     
    現在、Wikipedia の情報を中心に様々な Open Data を関連づけて活用する Linked Open Data の研究が行われている。本発表では、Wikipedia のページが表現する情報の粒度が与える影響について考察を行う。
  • 酒井 哲也, 上保 秀夫, 神門 典子, 加藤 恒昭, 相澤 彰子, 秋葉 友良, 後藤 功雄, 木村 文則, 三田村 照子, 西崎 博光, 嶋 秀樹, 吉岡 真治, Shlomo Geva, Ling-XiangTang, Andrew Trotman, Yue Xu 研究報告デジタルドキュメント(DD) 2012 (5) 1 -15 2012年03月19日 [査読無し][通常論文]
     
    NTCIR (エンティサイル) は国立情報学研究所 (NII) が主催する情報アクセス技術の評価型ワークショップシリーズで,1999 年以来一年半サイクルで開催されている.第 9 回ワークショップ (NTCIR-9) が 2011 年 12 月に終わり,第 10 回 (NTCIR-10) の採択タスクが今年 1 月にアナウンスされたところである.本稿では,NTCIR-9 の簡単な総括を行うとともに,NTCIR-10 の新たな取り組みについて紹介する.NTCIR is a sesquiannual evaluation workshop series on information access which started in 1999 and is run by National Institute of Informatics (NII). The ninth workshop (NTCIR-9) was concluded in December 2011 and the accepted tasks for the tenth workshop (NTCIR-10) have been announced in January 2012. This paper provides a brief summary of NTCIR-9, and introduces some latest developments from NTCIR-10.
  • 酒井 哲也, 上保 秀夫, 神門 典子, 加藤 恒昭, 相澤 彰子, 秋葉 友良, 後藤 功雄, 木村 文則, 三田村 照子, 西崎 博光, 嶋 秀樹, 吉岡 真治, Shlomo Geva, Ling-XiangTang, Andrew Trotman, Yue Xu 研究報告情報基礎とアクセス技術(IFAT) 2012 (5) 1 -15 2012年03月19日 [査読無し][通常論文]
     
    NTCIR (エンティサイル) は国立情報学研究所 (NII) が主催する情報アクセス技術の評価型ワークショップシリーズで,1999 年以来一年半サイクルで開催されている.第 9 回ワークショップ (NTCIR-9) が 2011 年 12 月に終わり,第 10 回 (NTCIR-10) の採択タスクが今年 1 月にアナウンスされたところである.本稿では,NTCIR-9 の簡単な総括を行うとともに,NTCIR-10 の新たな取り組みについて紹介する.NTCIR is a sesquiannual evaluation workshop series on information access which started in 1999 and is run by National Institute of Informatics (NII). The ninth workshop (NTCIR-9) was concluded in December 2011 and the accepted tasks for the tenth workshop (NTCIR-10) have been announced in January 2012. This paper provides a brief summary of NTCIR-9, and introduces some latest developments from NTCIR-10.
  • DIEB Thaer M, YOSHIOKA Masaharu, HARA Shinjiro 言語処理学会年次大会発表論文集 18th (CD-ROM) ROMBUNNO.B5-2 2012年03月13日 [査読無し][通常論文]
  • HU Shuo, 高橋佑介, 牧田健作, 横本大輔, 宇津呂武仁, 吉岡真治 言語処理学会年次大会発表論文集 18th (CD-ROM) ROMBUNNO.F1-5 2012年03月13日 [査読無し][通常論文]
  • 高村慎太郎, 吉岡真治, 関洋平 言語処理学会年次大会発表論文集 18th (CD-ROM) ROMBUNNO.P1-11 2012年03月13日 [査読無し][通常論文]
  • 高橋佑介, 横本大輔, 宇津呂武仁, 吉岡真治 言語処理学会年次大会発表論文集 18th (CD-ROM) ROMBUNNO.F1-4 2012年03月13日 [査読無し][通常論文]
  • 小池大地, 横本大輔, 牧田健作, 鈴木浩子, 宇津呂武仁, 河田容英, 吉岡真治, 福原知宏 言語処理学会年次大会発表論文集 18th (CD-ROM) ROMBUNNO.A5-1 2012年03月13日 [査読無し][通常論文]
  • 時系列トピックモデルにおけるバーストの同定
    高橋 佑介, 横本 大輔, 宇津呂 武仁, 吉岡 真治, 河田 容英, 神門 典子, 福原 知宏, 中川 裕志, 清田 陽司 第4回データ工学と情報マネージメントに関するフォーラム(DEIM 2012)論文集 F5-5 2012年03月 [査読無し][通常論文]
  • ブロガーの話題分布の俯瞰と分析
    牧田 健作, 横本 大輔, 鈴木 浩子, 宇津呂 武仁, 河田 容英, 神門 典子, 福原 知宏, 中川 裕志, 吉岡 真治, 清田 陽司 第4回データ工学と情報マネージメントに関するフォーラム(DEIM 2012)論文集 F7-4 2012年03月 [査読無し][通常論文]
  • ニュース・ブログにおける話題の相関と変遷の分析--- 震災に関する話題を例題として ---
    小池 大地, 横本 大輔, 牧田 健作, 鈴木 浩子, 宇津呂 武仁, 河田 容英, 吉岡真治, 神門典子, 福原 知宏, 中川, 清田 陽司, 関 洋平 第4回データ工学と情報マネージメントに関するフォーラム(DEIM 2012)論文集 F1-4 2012年03月 [査読無し][通常論文]
  • 藤原 嵩大, 吉岡 真治 人工知能学会全国大会論文集 2012 (0) 2C1NFC24 -2C1NFC24 2012年 [査読無し][通常論文]
     

    Wikipediaには階層的なカテゴリが付与されている。この階層に存在する様々な関係を 利用したWikipediaオントロジーの研究が行われている。 しかし、カテゴリに対する網羅的な分析は行われておらず、アドホックな利用法が提案 されているのみである。そこで、本研究ではWikipediaの全てのカテゴリに対して表記 パターンによる分類を行い、その結果を用いた階層間の関係の分類を行う。

  • 小池 大地, 牧田 健作, 宇津呂 武仁, 河田 容英, 吉岡 真治, 福原 知宏 人工知能学会全国大会論文集 2012 (0) 3E1R69 -3E1R69 2012年 [査読無し][通常論文]
     

    本論文では,震災に関する話題についての時系列のニュース記事集合,および, ブログ記事集合を対象として,トピックモデルを用いたトピック同定を行い, ニュース・ブログの間での話題の相関を分析する.本論文では,特に,各トピッ クと密接に対応するニュース記事集合・ブログ記事集合における話題がどの程度 まとまっているか,という点と,時系列バーストの有無との相関について分析を 行った結果を報告する.

  • 吉岡 真治, 神門 典子, 関 洋平 研究報告 情報基礎とアクセス技術(IFAT) 2011 (2) 1 -8 2011年07月26日 [査読無し][通常論文]
     
    本研究では、日中韓を中心とした複数国の新聞を比較分析する NSContrast を提案している。本システムでは、実際に毎日の新聞を新聞社のサイトから収集し、その日に注目を浴びている単語のリストや、そのような単語を含む記事数の増減や関連語などを表示することにより、従来のニュースポータルとは異なった観点からの新聞記事分析を可能にするものである。本稿では、本システムの有効性を検証するために行ったユーザ実験とその分析結果について報告する。We have already proposed a system News Site Contrast(NSContrast) that analyzing the characteristic difference between each news site and all others. The system make news article database by retrieving articles from multiple news sites in daily basis. In addition, the system have functions to analyze these articles by showing the hot keywords, related keywords for the retrieved documents. In this paper, we report the result of user experiment and analysis of the results.
  • 吉岡 真治, 神門 典子, 関 洋平 研究報告 データベースシステム(DBS) 2011 (2) 1 -8 2011年07月26日 [査読無し][通常論文]
     
    本研究では、日中韓を中心とした複数国の新聞を比較分析する NSContrast を提案している。本システムでは、実際に毎日の新聞を新聞社のサイトから収集し、その日に注目を浴びている単語のリストや、そのような単語を含む記事数の増減や関連語などを表示することにより、従来のニュースポータルとは異なった観点からの新聞記事分析を可能にするものである。本稿では、本システムの有効性を検証するために行ったユーザ実験とその分析結果について報告する。We have already proposed a system News Site Contrast(NSContrast) that analyzing the characteristic difference between each news site and all others. The system make news article database by retrieving articles from multiple news sites in daily basis. In addition, the system have functions to analyze these articles by showing the hot keywords, related keywords for the retrieved documents. In this paper, we report the result of user experiment and analysis of the results.
  • DIEB Thaer M, YOSHIOKA Masaharu 言語処理学会年次大会発表論文集 17th (CD-ROM) ROMBUNNO.P1-29 2011年03月 [査読無し][通常論文]
  • 特定トピックに関するブログ記事集合の観点分類におけるWikipediaの利用
    横本 大輔, 林 東權, 牧田 健作, 宇津呂 武仁, 河田 容英, 福原 知宏, 神門 典子, 吉岡 真治, 中川 裕志, 清田 陽司 第3回データ工学と情報マネジメントに関するフォーラム 2011年02月 [査読無し][通常論文]
  • Daisuke Yokomoto, Dangkwon Lim, Kensaku Makita, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa, Yoji Kiyota Proceedings of DEIM Forum 2011 2011年02月 [査読無し][通常論文]
  • 竹中 均, 吉岡 真治 人工知能学会全国大会論文集 2011 (0) 2J3NFC22 -2J3NFC22 2011年 [査読無し][通常論文]
     

    東京の記述に日本という説明を加えないように、地名を含む情報を記載する場合に、その包含関係の情報を明示的に記述しないことが多い。しかし、これらの地名に関連した情報を検索する場合には、このような暗黙に仮定している関係の情報を利用する必要がある。本研究では、Wikipediaを対象にして、このような検索に有用な地名の包含関係情報の抽出方法を提案する。

  • 吉岡 真治, Thaer Dieb, 原 真二郎, 冨岡 克広, 福井 孝志 人工知能学会全国大会論文集 2011 (0) 3G41 -3G41 2011年 [査読無し][通常論文]
     

    本研究では、 ナノ結晶デバイスの開発プロセスにおけるデバイス生成のための実験記録を情報源として、試行錯誤の背後にある暗黙知の明示化を支援する実験記録データの活用システムの構築を目指している。 本発表では、実験記録データに評価データ、背景情報などのメタデータを追加する事を提案し、その活用方法について述べる。

  • 吉岡 真治, Thaer Dieb, 冨岡 克広 人工知能学会全国大会論文集 25 1 -4 2011年 [査読無し][通常論文]
  • 竹中 均, 吉岡 真治 人工知能学会全国大会論文集 25 1 -4 2011年 [査読無し][通常論文]
  • 高橋佑介, 横本 大輔, 宇津呂 武仁, 吉岡 真治 情報処理学会研究報告.自然言語処理研究会報告 6 (6) 1 -6 2011年 [査読無し][通常論文]
     
    本論文では,時系列ニュースを対象として,情報集約を行うための二種類の方式として,バースト解析およびトピックモデルの2つの手法の考え方を組み合わせることにより,トピックのバーストを検出する方式を提案する.時系列ニュースにおけるバーストとは,世の中における特異な出来事に対応して,ある時期からその出来事に関連するニュース記事が急激に増加する現象を指す.バーストを検出するための代表的な手法として,Kleinbergのバースト解析が挙げられる.この手法においては,一般的に,バーストの検出はキーワード単位で行われる.一方,文書集合におけるトピックの分布を推定するものとしてLDA (latent Dirichlet allocation) やDTM (dynamic topic model) に代表されるトピックモデルがある.トピックモデルを適用することにより,ニュース記事集合全体の情報を,いくつかのトピックに集約することができる.以上の既存技術をふまえて,本論文では,DTMを用いて推定したトピックに対してバースト度を付与することで,トピック単位のバーストが検出可能であることを示す.Among various types of recent information explosion, that in news stream is also a kind of serious problems. This paper studies issues regarding two types of modeling of information flow in news stream, namely, burst analysis and topic modeling. First, when one wants to detect a kind of topics that are paid much more attention than usual, it is usually necessary for him/her to carefully watch every article in news stream at every moment. In such a situation, it is well known in the field of time series analysis that Kleinberg's modeling of bursts is quite effective in detecting burst of keywords. Second, topic models such as LDA (latent Dirichlet allocation) and DTM (dynamic topic model) are also quite effective in estimating distribution of topics over a document collection such as articles in news stream. This paper focuses on the fact that Kleinberg's modeling of bursts is usually applied only to bursts of keywords but not to those of topics. Then, based on Kleinberg's modeling of bursts of keywords, we propose how to measure bursts of topics estimated by a topic model such as LDA and DTM.
  • 吉岡真治, 伊藤正彦, SEBAG Michele, FEKETE Jean‐Daniel 情報処理学会研究報告(CD-ROM) 2009 (6) ROMBUNNO.FI-98,8 2010年04月15日 [査読無し][通常論文]
  • 吉岡 真治 全国大会講演論文集 72 (0) 301 -302 2010年03月08日 [査読無し][通常論文]
  • 吉岡 真治, 伊藤 正彦, Sebag Michele, Jean-DanielFekete 情報処理学会研究報告. 情報学基礎研究会報告 98 (8) H1 -H6 2010年03月04日 [査読無し][通常論文]
     
    多次元尺度構成法(MDS)は、高次元のデータを2次元で表現する手法である。しかし、ユーザが初期の出力結果に満足できない場合が存在する。この問題に対し、本発表では、ユーザにとって分類に役立つ次元を学習する距離尺度学習の手法を応用することによって、MDSの結果をインタラクティブに操作する方法を提案する。また、このシステムを論文の類似度を元にして作成した複数研究者の関係を可視化するシステムに適用した結果について紹介する。Multi Dimensional Scaling (MDS) is one of the popular method for visualizing multidimensional data into 2D world. However, the user may not satisfy the visualization results. In this paper, we propose a novel interactive method for modifying MDS visualization results by using the concept of distance metric learning. We also demonstrate our researcher visualization system based on this algorithm.
  • 吉岡 真治, 伊藤 正彦, Sebag Michele, Jean-DanielFekete 情報処理学会研究報告. DD, [デジタル・ドキュメント] 75 (8) H1 -H6 2010年03月04日 [査読無し][通常論文]
     
    多次元尺度構成法(MDS)は、高次元のデータを2次元で表現する手法である。しかし、ユーザが初期の出力結果に満足できない場合が存在する。この問題に対し、本発表では、ユーザにとって分類に役立つ次元を学習する距離尺度学習の手法を応用することによって、MDSの結果をインタラクティブに操作する方法を提案する。また、このシステムを論文の類似度を元にして作成した複数研究者の関係を可視化するシステムに適用した結果について紹介する。Multi Dimensional Scaling (MDS) is one of the popular method for visualizing multidimensional data into 2D world. However, the user may not satisfy the visualization results. In this paper, we propose a novel interactive method for modifying MDS visualization results by using the concept of distance metric learning. We also demonstrate our researcher visualization system based on this algorithm.
  • 吉岡 真治 電子情報通信学会技術研究報告. AI, 人工知能と知識処理 109 (424) 43 -46 2010年02月15日 [査読無し][通常論文]
     
    辞書を利用する機械翻訳システムにおいて、未登録語が多く存在する文書の翻訳結果は、質の悪いものとなる。しかし、辞書のメンテナンスは非常にコストがかかり、新語や、時事的な単語を辞書に継続的に登録することは容易ではない。本研究では、このような機械翻訳の辞書を補完するという目標のもとに、Wikipediaの言語間リンクを用いて中日の翻訳辞書を作成する方法を提案する。また、この翻訳辞書の活用事例として、多言語ニュースサイトの比較分析システムNSContrastの紹介を行う。
  • Yusuke Abe, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa, Yoji Kiyota, Masatoshi Tsuchiya ACTIVE MEDIA TECHNOLOGY 6335 498 -+ 2010年 [査読有り][通常論文]
     
    Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for those who are not familiar with tips for preventing being victimized. This paper proposes a framework of extracting people's concerns and reports on crimes in their own blogs. In this framework, we solve two tasks. In the first task, we focus on experts in crime domain and address the issue of extracting concerns on crimes such as tips for preventing being victimized. In the evaluation of this first task, we show that we successfully rank expert bloggers high in the results of blog feed retrieval. In the second task, on the other hand, we focus on victims of criminal acts, and address the issue of extracting reports on being victimized In the evaluation of this second task, we show that we outperform blog post ranking based on the search engine API by incorporating dependency relations for identifying victims' blog posts.
  • Masaharu Yoshioka INFORMATION RETRIEVAL TECHNOLOGY 6458 588 -598 2010年 [査読有り][通常論文]
     
    To make a good question answering (QA) system based on a text database, it is preferable to have a good information retrieval (IR) system that can find appropriately relevant document sets for a given query. To make a good IR system for QA about particular named entities (NEs), it is preferable to use a Boolean IR model that uses appropriate Boolean queries with the NE information. In this paper, we propose to use appropriate Boolean query reformulation for information retrieval (ABRIR) for this problem. In this system, an appropriate list of synonyms and variations of Japanese katakana descriptions of a given query are used to construct the Boolean query. Evaluation results show that ABRIR works effectively for the IR. task in QA.
  • 吉岡 真治, 冨岡 克広, 原 真二郎, 福井 孝志 人工知能学会全国大会論文集 2010 (0) 1B33 -1B33 2010年 [査読無し][通常論文]
     

    ナノ結晶デバイスの開発プロセスにおいては、製造プロセスがデバイスの性質に大きな影響を与えるため、試行錯誤的な実験の繰り返しが必要とされる。しかし、その試行錯誤に関する知識はあまり明示化されていないため、熟練者の「匠の技」である暗黙知に依存している。本研究では、デバイス生成のための実験を行った記録を情報源として、この暗黙知の明示化を支援する実験記録データの活用システムを提案する。

  • 吉岡 真治, 冨岡 克広, 原 真二郎 人工知能学会全国大会論文集 24 1 -4 2010年 [査読無し][通常論文]
  • 中崎 寛之, 阿部 佑亮, 宇津呂 武仁, 河田 容英, 福原 知宏, 神門 典子, 吉岡 真治, 中川 裕志, 清田 陽司 情報処理学会研究報告. 自然言語処理研究会報告 194 (9) I1 -I8 2009年11月16日 [査読無し][通常論文]
     
    我々は,これまで,ブログ空間中に存在する有用な情報や知識に的確にアクセスし利用するという目的のもとで,体系化された知識体系である Wikipedia とブログサイトを対応づける研究を行ってきた.しかし,同一のトピックについて記述しているブログであっても,ブロガーの立場や環境は大いに異なることがわかった.そこで,本研究では,ブログ空間の情報や知識を類型化するための方式の一つとして,「ブロガーの立場」 に着目してブログサイト・ブログ記事を類型化するというアプローチをとる.具体的には,本稿では,特定トピックについてのブログに含まれる情報の有用性を検証するための事例研究として,「詐欺」,「インターネット犯罪」 の分野を対象として,日英ブログサイトおよびブログ記事の収集を行い,ブログでの記述内容を被害者・ニュース記事引用・防止対策に類型化した結果を報告する.日英各言語のブログサイト・ブログ記事の収集には,ある同一トピックについて詳しい記述をしているブログサイトを検索する手法と,検索エンジンによるブログ記事検索手法を組み合わせて用いた.そして,収集したブログサイト・ブログ記事にはどのようなタイプの立場があるかを分析し,それらを類型化した.Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for outsiders from abroad who are not familiar with cultures and crimes in foreign countries. This paper proposes a multilingual framework of categorizing people's concerns, reports, and experiences on crimes in their own blogs. First, we refer to Wikipedia as a multilingual terminological knowledge base, and search for Wikipedia entries describing criminal acts. In the retrieval of blog feeds/posts, we take two approaches, focusing on various types of bloggers such as experts in the crime domain and victims of criminal acts. We further categorize the retrieved blog feeds/posts into four types including experts in the crime domain and victims of criminal acts.
  • 佐藤 由紀, 横本 大輔, 中崎 寛之, 宇津呂 武仁, 吉岡 真治, 福原 知宏, 神門 典子, 中川 裕志, 清田 陽司 情報処理学会研究報告. 自然言語処理研究会報告 194 (10) J1 -J8 2009年11月16日 [査読無し][通常論文]
     
    本研究では,検索エンジン等を用いた検索行動のうちでも,特に,客観的かつ恒久的な事実を記載した Wikipedia,詳細な事実情報を報道するニュース,および,個人の主観的意見や経験などを豊富に記載したブログの検索に焦点を当てて,利用者の検索行動を支援する枠組みを提供することを目的とする.本論文では,Wikipedia エントリを介して,関連するニュース・ブログを対応付ける方式において,各 Wikipedia エントリの有効性を分析し,ニュース・ブログ間の相補的検索において Wikipedia エントリを選別するためのインタフェースを設計する.特に,本稿では,Wikipedia エントリを介して,ニュース記事に関連するブログ記事を検索する方式を評価した.システムが提示した Wikipedia エントリのうち,入力となるニュース記事と密接に関連するエントリを利用者が自在に選択し,選択されたエントリのみを用いて関連ブログ記事の検索を行うための相補的ナビゲーション・インタフェースを作成した.評価実験の結果,利用者が適切なエントリの選択を行うことによって,ブログ記事検索結果における関連ブログ記事の割合を大幅に改善することができた.We study complementary navigation of news and blog, where Wikipedia entries are utilized as fundamental knowledge source for linking news articles and blog feeds/posts. In the proposed framework, given a topic as the title of a Wikipedia entry, its Wikipedia entry body text is analyzed as fundamental knowledge source for the given topic, and terms strongly related to the given topic are extracted. Those terms are then used for ranking news articles and blog posts. In the scenario of complementary navigation from a news article to closely related blog posts, Japanese Wikipedia entries are ranked according to the number of strongly related terms shared by the given news article and each Wikipedia entry. Then, top ranked 10 entries are regarded as indices for further retrieving closely related blog posts. All the retrieved blog posts are finally ranked all together. The retrieved blog posts are then shown to users as blogs of personal opinions and experiences that are closely related to the given news article. In our preliminary evaluation, through an interface for manually selecting relevant Wikipedia entries, the rate of successfully retrieving relevant blog posts improved.
  • 角谷和俊, 吉岡真治, 佐藤哲司 情報処理学会論文誌データベース(TOD) 2 (3) i -iii 2009年09月30日 [査読無し][通常論文]
  • 角谷 和俊, 吉岡 真治, 佐藤 哲司 情報処理学会論文誌データベース(TOD) 2 (2) i -iii 2009年06月29日 [査読無し][通常論文]
  • 角谷 和俊, 吉岡 真治, 佐藤 哲司 情報処理学会論文誌. データベース 2 (2) i -iii 2009年06月29日 [査読無し][通常論文]
  • 吉岡 真治 情報処理学会研究報告. DD, [デジタル・ドキュメント] 71 (1) A1 -A8 2009年06月05日 [査読無し][通常論文]
     
    本研究では、複数国のニュースサイトにおける興味の違いを比較対照分析するためのシステム NSContrast を提案している。この NSContrast では、各国のニュースサイトの日本語版の記事だけではなく、原語版の機械翻訳結果も組み合わせたデータベースをもとに、共起語解析やバースト解析を行うことにより、その違いを分析する。本発表では、この NSContrast における評価手法についての検討結果を分析実験の結果と共に報告する。In this research we have already proposed a news site analysis system NSContrast that characterizes the differences among news sites from multiple countries. In this analysis system, news articles database are constructed by using following three types of news sites data; Japanese news articles written in Japanese, foreign ones written in Japanese and machine translated version of foreign ones written in foreign language. In this paper, we discuss how to evaluate the effectiveness of the NSContrast and briefly introduced the result of user experiment study.
  • 角谷 和俊, 吉岡 真治, 佐藤 哲司 情報処理学会論文誌データベース(TOD) 2 (1) i -iii 2009年03月31日 [査読無し][通常論文]
  • 大塚 博紀, 吉岡 真治 情報処理学会研究報告. DD, [デジタル・ドキュメント] 2009 (35) 9 -14 2009年03月18日 [査読無し][通常論文]
     
    Web文書の特徴はリンクによりお互いの文書の関係が示されている点にあり、この情報はPageRankに代表されるWeb空間の解析手法に用いられている。しかし、これらの解析では、サイト内、サイト外といった分類は考慮されているものの、ページの中でのアンカーテキストの役割には、注目していない。本研究では、このアンカーテキストの役割の違いに注目し、適切に分類することで、リンク構造解析やWebページ上でのユーザーの行動解析に役立てる事を目標としている。本稿では、人手による役割分析の結果に基づいたアンカーテキストの自動分類システムを提案する。また、その有効性を検証するために、実際に人手の分類とシステムの出力を比較した結果について報告する。
  • 大塚 博紀, 吉岡 真治 情報処理学会研究報告. 情報学基礎研究会報告 94 (35) 9 -14 2009年03月18日 [査読無し][通常論文]
     
    Web文書の特徴はリンクによりお互いの文書の関係が示されている点にあり、この情報はPageRankに代表されるWeb空間の解析手法に用いられている。しかし、これらの解析では、サイト内、サイト外といった分類は考慮されているものの、ページの中でのアンカーテキストの役割には、注目していない。本研究では、このアンカーテキストの役割の違いに注目し、適切に分類することで、リンク構造解析やWebページ上でのユーザーの行動解析に役立てる事を目標としている。本稿では、人手による役割分析の結果に基づいたアンカーテキストの自動分類システムを提案する。また、その有効性を検証するために、実際に人手の分類とシステムの出力を比較した結果について報告する。
  • 吉岡真治 言語処理学会年次大会発表論文集 15th 494-497 2009年03月02日 [査読無し][通常論文]
  • 佐藤由紀, 中崎寛之, 川場真理子, 宇津呂武仁, 吉岡真治, 福原知宏, 中川裕志, 神門典子 言語処理学会年次大会発表論文集 15th 300-303 2009年03月02日 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会全国大会論文集 2009 (0) 2G1NFC58 -2G1NFC58 2009年 [査読無し][通常論文]
     

    本研究では、様々な国から発信される多言語ニュースに対し、機械翻訳システムを利用して対照比較を行うNSContrastの研究を行っている。本システムの分析には、翻訳間違いや表記の違いが解析に大きな影響を与えるため、正規化が必要である。本稿では、Wikipediaの言語間リンクを用いた翻訳用辞書の生成や、redirectの関係を用いた表記のバリエーションへの対応を行い、実運用における評価を行う。

  • 杉山 明紀, 下村 芳樹, 千葉 龍介, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2009 (0) 211 -212 2009年 [査読無し][通常論文]
     
    創造的設計のためには,異領域知識間の柔軟な統合が重要であると考えられており,著者らはそれを実現する統合計算機環境の開発を行っている.本稿では,知識中に記述される語彙情報から階層構造と単位次元により表現する視点情報を計算機により自動的に推定・付与するシステムを提案・開発する.また,視点情報に基づき生成する仮説的知識の創造性と有用性を可変とする操作性を,事例を用いた検証により確認する.
  • 吉岡 真治 論文集 23 1 -4 2009年 [査読無し][通常論文]
  • 高橋 潔考, 杉山 明紀, 下村 芳樹, 舘山 武史, 千葉 龍介, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2009 (0) 209 -210 2009年 [査読無し][通常論文]
     
    前報までに、著者らは創造的設計の総合支援環境であるUniversal Abduction Studio(UAS)で利用するための設計に有用な情報を、Web上から自動取得し、当該システム用の知識ベースを構築するための基本手法を提案した。本稿では、上記提案手法を計算機上の一連のソフトウェアとして実装した内容と、実装システムにより取得された知識の設計上の利用可能性のさらに詳細な検証結果について報告する。
  • 角谷和俊, 吉岡真治, 佐藤哲司 情報処理学会論文誌データベース(TOD) 1 (2) i -iii 2008年09月30日 [査読無し][通常論文]
  • 原口 誠, 吉岡 真治 人工知能基本問題研究会 70 (0) 49 -52 2008年07月04日 [査読無し][通常論文]
  • 原口誠, 吉岡真治 人工知能学会人工知能基本問題研究会資料 70th 49-52 2008年06月30日 [査読無し][通常論文]
  • 角谷和俊, 吉岡真治, 佐藤哲司 情報処理学会論文誌データベース(TOD) 1 (1) i -iii 2008年06月26日 [査読無し][通常論文]
  • 井川 拓, 原口 誠, 吉岡 真治 ことば工学研究会 28 (0) 31 -34 2008年03月28日 [査読無し][通常論文]
  • 秋葉 隆次, 原口 誠, 吉岡 真治 人工知能基本問題研究会 69 (0) 39 -42 2008年03月24日 [査読無し][通常論文]
  • 吉岡真治 言語処理学会年次大会発表論文集 14th 592-595 2008年03月17日 [査読無し][通常論文]
  • 角谷 和俊, 吉岡 真治, 佐藤 哲司 情報処理学会論文誌データベース(TOD) 49 (7) i -iii 2008年03月15日 [査読無し][通常論文]
  • 秋葉隆次, 原口誠, 吉岡真治 人工知能学会人工知能基本問題研究会資料 69th 39-42 2008年03月14日 [査読無し][通常論文]
  • 大塚 博紀, 吉岡 真治 全国大会講演論文集 70 (0) 209 -210 2008年03月13日 [査読無し][通常論文]
  • Masaharu Yoshioka INFORMATION RETRIEVAL TECHNOLOGY 4993 508 -513 2008年 [査読有り][通常論文]
     
    In order to utilize news articles from multiple news sites, it is better to understand the characteristics of each news site. In this paper, a concept of contrast set mining is applied for analyzing the characteristic difference between each news site and all others. The News Site Contrast (NSContrast) system is also proposed based on this mining technique. This system is applied to a news article database constructed from multiple news sites from different countries in order to evaluate its effectiveness.
  • 大塚 博紀, 吉岡 真治 人工知能学会全国大会論文集 8 (0) 203 -203 2008年 [査読無し][通常論文]
     
    本研究では、Webのリンク構造を分類して利用することを目標として、アンカーテキストの情報を用いたリンクの役割分析を行っている。本発表では、役割分類の基準とそれに基づいた自動分類の手法について提案する。
  • 杉山明紀, 下村芳樹, 千葉龍介, 吉岡真治, 武田英明 Designシンポジウム講演論文集 2008 441-446 2008年 [査読無し][通常論文]
  • 大塚 博紀, 吉岡 真治 人工知能学会全国大会論文集 22 1 -3 2008年 [査読無し][通常論文]
  • 中西 雅俊, 鈴木 遼, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2008 (0) 435 -436 2008年 [査読無し][通常論文]
     
    本研究では創造的設計を総合的に支援する計算機環境の構築を目指している。著者らは、これまでに創造的設計を支援するための知識記述形式や推論機構、オントロジー利用の枠組みなどを提案してきた。しかしながらこれらを用いて創造的な設計を支援するためには以上の構成要素群を統合する必要がある。本稿では創造的設計を支援するための統合計算機環境を提案し、その具体的な実装構造を例示する。
  • 高橋 潔考, 鈴木 遼, 下村 芳樹, 舘山 武史, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2008 (0) 437 -438 2008年 [査読無し][通常論文]
     
    近年、人工物に対する要求がより高度化・複雑化することに伴い、設計者による包括的な問題解決が求められている。以上の背景のもと、著者らは創造的設計を総合的に支援する計算機環境Universal Abduction Studio(UAS)を提案している。本稿では、情報抽出の手法を用いてWeb情報から設計に有用な情報を取得することにより、UASの設計知識データベースを効率的に拡充するための手法を提案する。
  • 杉山 明紀, 下村 芳樹, 千葉 龍介, 武田 英明, 吉岡 真治 精密工学会学術講演会講演論文集 2008 (0) 647 -648 2008年 [査読無し][通常論文]
     
    著者らは,創造的設計を支援する統合計算機環境の構築を行っている.これまでに,語彙情報をタグ付けした知識から概念類似度を基に生成される仮説的知識の有用性向上手法を提案しているが,場面に即した仮説的知識を効率的に取得するためには語彙の属性に基づくタグ付け手法とそれを用いた推論が有効である.本稿では,知識に対して語彙情報に基づく物理量をタグ付けする知識表現手法を提案し,その有効性を検証する.
  • 高橋 潔考, 杉山 明紀, 下村 芳樹, 舘山 武史, 千葉 龍介, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2008 (0) 649 -650 2008年 [査読無し][通常論文]
     
    近年,人工物に対する要求の高度化・複雑化に伴い,設計者に対する負担が一層増大している.以上の背景のもと,著者らは創造的設計を総合的に支援する計算機環境Universal Abduction Studio(UAS)を提案している.本稿では,設計に有用な情報をWeb情報より自動的に取得,UASで利用可能な知識表現に変換することにより,UASの設計知識データベースを効率的に拡充するための手法を提案する.
  • 杉山 明紀, 下村 芳樹, 吉岡 真治, 武田 英明 設計工学・システム部門講演会講演論文集 2008 (0) 181 -185 2008年 [査読無し][通常論文]
     
    In order to realize a creative design, it is thought to be important to unify the knowledge from different knowledge areas flexibly. The computer environment that supports designers in an integrated way has been developed. The extended method of the knowledge representation forms for increasing the usefulness of the hypothetical knowledge from the knowledge tagged with vocabulary information was proposed. However, the current method isn't always capable of obtaining the useful knowledge, since it doesn't consider the context. In order to acquire the hypothetical knowledge adapted to the context efficiently, the tagging technique based on the attribute of a vocabulary and the reasoning using it are effective. In this paper, the authors propose knowledge representation forms for tagging physical quantity based on vocabulary describing knowledge, and verify the usefulness of the proposed method.
  • 高橋 潔考, 下村 芳樹, 舘山 武史, 吉岡 真治, 武田 英明 設計工学・システム部門講演会講演論文集 2008 (0) 305 -309 2008年 [査読無し][通常論文]
     
    In recent years, comprehensive problem solving by a designer has been required as the demand for an artifact grows and complicates more. In the above background, we have proposed Universal Abduction Studio (UAS), a computer environment, which supports a creative design synthetically. However, it is difficult for designers to acquire knowledge in multiple domains efficiently because they have to accumulate the design knowledge by the handwork. Thus far, we proposed Web-based design knowledge information database extension method. In this paper, we propose the conversion method acquired design knowledge information from the resource on Web into knowledge expression for UAS.
  • 角谷 和俊, 吉岡 真治, 佐藤 哲司 情報処理学会論文誌データベース(TOD) 48 (20) i -iii 2007年12月15日 [査読無し][通常論文]
  • 吉岡 真治 ヒューマンインタフェース学会誌 = Journal of Human Interface Society : human interface 9 (4) 269 -274 2007年11月25日 [査読無し][通常論文]
  • 杉山明紀, 鈴木遼, 中西雅俊, 下村芳樹, 吉岡真治, 武田英明 日本機械学会設計工学・システム部門講演会講演論文集 17th 286-287 2007年10月30日 [査読無し][通常論文]
  • 武田英明, 下村芳樹, 吉岡真治 設計工学 42 (10) 558-564 2007年10月05日 [査読無し][通常論文]
  • 杉山明紀, 鈴木遼, 中西雅俊, 下村芳樹, 吉岡真治, 武田英明 精密工学会大会学術講演会講演論文集 2007 G67 2007年09月03日 [査読無し][通常論文]
  • 吉岡 真治 情報処理 48 (8) 920 -921 2007年08月15日 [査読無し][通常論文]
  • 適合的汎化に基づく情報検索システムの実験的研究
    吉岡 真治, 原口誠 NICT-EDR電子化辞書シンポジウム - (-) 67 -76 2007年04月 [査読無し][通常論文]
  • 複数のニュース源の差異を考慮したニュース分析の研究,「大規模Web研究基盤上での自然言語処理・情報検索」
    吉岡真治 言語処理学会第13回年次大会ワークショップ (W2) 27 -30 2007年03月 [査読無し][通常論文]
  • 吉岡 真治, 矢入 郁子, Masaharu Yoshioka, Ikuko Yairi 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 22 (2) 208 -208 2007年03月01日 [査読無し][通常論文]
  • 吉岡 真治, 矢入 郁子 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 22 (2) 208 -208 2007年03月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能 22 (1) 15 -15 2007年 [査読無し][通常論文]
  • 吉岡 真治, Masaharu Yoshioka 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 22 (1) 15 -15 2007年01月01日 [査読無し][通常論文]
  • 杉山 明紀, 鈴木 遼, 中西 雅俊, 下村 芳樹, 吉岡 真治, 武田 英明 設計工学・システム部門講演会講演論文集 2007 (0) 286 -287 2007年 [査読無し][通常論文]
     
    In order to realize a creative design, it is thought to be important to unify the different knowledge group flexibly, and the concept of the computer environment which supports designers in an integrated way has been proposed. Our project, called Universal Abduction Studio, aims at assisting designers in obtaining design solutions through the dynamic interaction between a system and a designer. In this report, we propose the extended method of the knowledge representation forms for increasing the usefulness of hypothetical knowledge, after considering the existing reasoning environment. Finally, the usefulness of the proposed method is verified.
  • 杉山 明紀, 鈴木 遼, 中西 雅俊, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2007 (0) 523 -524 2007年 [査読無し][通常論文]
     
    創造的な設計を実現するためには異領域知識間の柔軟な統合が重要と考えられ,それを総合的に支援する計算機環境であるUniversal Abduction Studioの概念が提案されている.本稿では,これまでに著者らが提案した推論機構に関する考察を行なった上で,計算機が導出する仮説的知識の有用性を,各分類と知識テンプレートの導入により向上させる知識表現形式の拡張方法を提案し,その有効性を検証する.
  • 高橋 潔考, 鈴木 遼, 下村 芳樹, 舘山 武史, 吉岡 真治, 武田 英明 横幹連合コンファレンス予稿集 2007 (0) 45 -45 2007年 [査読無し][通常論文]
     
    近年,人工物に対する要求がより高度化・複雑化することに伴い,設計者による包括的な問題解決が求められている.以上の背景のもと,著者らは創造的設計を総合的に支援する計算機環境Universal Abduction Studio(UAS)を提案している.本稿では, Web上のリソースから設計に有用な情報を抽出することにより,UASにおいて利用される設計知識情報データベースをより拡充する手法を提案する.
  • 吉岡 真治, 落合 翔平 精密工学会学術講演会講演論文集 2007 (0) 513 -514 2007年 [査読無し][通常論文]
     
    TRIZなどに代表されるようにアイディア検索のために特許を利用する方法が提案されている。このような状況では、表面上の表記に注目した同分野の特許を検索するのではなく、類似の問題を扱っている特許を検索することが重要となる。本研究では、アイディアの根幹にある物理法則をキーとした検索を考え、学習により文書に対して関連物理法則のラベルをつけ、分類する方法を提案する。
  • 吉岡 真治 情報処理学会研究報告. 自然言語処理研究会報告 2006 (94) 27 -33 2006年09月12日 [査読無し][通常論文]
     
    Web情報の最も大きな特徴は、ハイパーリンクにより、複数のページが関係付けられ、その関係がアンカーテキストという形で記述されている点にある。本研究では、大規模なWeb文書コレクションであるるNTCIRのnw100gテストコレクションから抽出したアンカーテキストを対象に、アンカーテキストの機能分類を提案すると共に、機能分類の自動化のための方針、機能分類の特徴を生かしたWeb情報活用システムの応用手法について述べる。
  • 吉岡 真治 情報処理学会研究報告. FI,.情報学基礎研究会報告 84 (94) 27 -33 2006年09月12日 [査読無し][通常論文]
     
    Web情報の最も大きな特徴は、ハイパーリンクにより、複数のページが関係付けられ、その関係がアンカーテキストという形で記述されている点にある。本研究では、大規模なWeb文書コレクションであるるNTCIRのnw100gテストコレクションから抽出したアンカーテキストを対象に、アンカーテキストの機能分類を提案すると共に、機能分類の自動化のための方針、機能分類の特徴を生かしたWeb情報活用システムの応用手法について述べる。
  • 吉岡 真治, 佐藤 孝彦, 森本 憲悟 人工知能基本問題研究会 62 (0) 71 -76 2006年03月27日 [査読無し][通常論文]
  • 伊東真樹, 森本憲悟, 下村芳樹, 武田英明, 吉岡真治 精密工学会大会学術講演会講演論文集 2006 M22 2006年03月01日 [査読無し][通常論文]
  • 中西雅俊, 森本憲悟, 下村芳樹, 武田英明, 吉岡真治 精密工学会大会学術講演会講演論文集 2006 M21 2006年03月01日 [査読無し][通常論文]
  • 森本憲悟, 下村芳樹, 吉岡真治, 武田英明, 上田完次 精密工学会大会学術講演会講演論文集 2006 M23 2006年03月01日 [査読無し][通常論文]
  • 吉岡 真治, 佐藤 孝彦, 杉山 明紀, 森本 憲悟, 武田 英明, 下村 芳樹 Designシンポジウム講演論文集 2006 (0) 95 -100 2006年 [査読無し][通常論文]
     
    In order to design new artifacts that are different from existing ones, it is crucial to have new knowledge for the design problem. We have already confirmed that combination of existing knowledge from different domain may useful for this process by analyzing design cases. In this paper, we briefly review our hypothetical knowledge generation support environment "Universal Abduction Studio" (UAS) and propose an automatic method to organize design document for this environment.
  • 中西 雅俊, 鈴木 遼, 下村 芳樹, 武田 英明, 吉岡 真治 設計工学・システム部門講演会講演論文集 2006 (0) 206 -207 2006年 [査読無し][通常論文]
     
    We argue that abduction for integrating theories can be a basic principle to formalize creative design processes. Based on this principle, we have proposed Universal Abduction Studio, a design environment in which designers combine different theories to arrive at better design. In this new approach to computational support of conceptual design, the system should offer various types of abductive reasoning from which designers can select an interesting design method. This paper aims at proposing the method of handling terminology by general common ontology and managing in the multiple. We also discuss technologies to implement proposed method of managing terminology.
  • 吉岡 真治, 佐藤 孝彦, 森本 憲悟, 武田 英明, 下村 芳樹 人工知能学会全国大会論文集 6 (0) 202 -202 2006年 [査読無し][通常論文]
     
    従来の設計解とは本質的に異なる創造的な設計解を作るためには、既存の知識の単純な組合わせではなく、新たな設計知識の利用が不可欠である。本研究では、これまで、異なる領域知識間に存在する類似性をキーとしたアナロジーを用いて、仮説的設計知識の生成手法を提案してきた。本発表では、このアナロジーを行なうために必要な文書情報のタグ付けを自動化するための方法論について述べる。
  • 伊東 真樹, 森本 憲悟, 下村 芳樹, 武田 英明, 吉岡 真治 精密工学会学術講演会講演論文集 2006 (0) 1001 -1002 2006年 [査読無し][通常論文]
     
    設計課題に関連する領域知識を用いるだけでは,創造的な設計解を得ることは困難である.本研究では創造的設計実現のためには,設計課題に関する領域知識とそれとは異なる領域知識の統合が重要であると考え,これを総合的に支援する計算機環境の構築を目指している.本稿ではより高度な知識統合を実現するために,知識の意味的構造に基づく統合を可能とする知識表現形式とその形式に従い知識を記述するためのエディタを提案する.
  • 森本 憲悟, 下村 芳樹, 武田 英明, 吉岡 真治, 上田 完次 精密工学会学術講演会講演論文集 2006 (0) 1003 -1004 2006年 [査読無し][通常論文]
     
    既知の知識のみからでは解を導出することが困難な創造的設計においては、新たな知見の導入や発想による知識の拡張が必要である。本研究ではこのような創造的設計過程の理解、および、それを総合的に支援するための計算機環境の構築を目指している。本稿ではこの創造的設計における知識拡張に必要な仮説的知識の生成を対話型進化的計算法に基づいて行う手法を提案する。さらに機能展開の知識に適用し提案手法の有効性を検証する。
  • 吉岡 真治, 佐藤 孝彦, 森本 憲悟 人工知能学会全国大会論文集 20 1 -4 2006年 [査読無し][通常論文]
  • 中西 雅俊, 鈴木 遼, 下村 芳樹, 武田 英明, 吉岡 真治 精密工学会学術講演会講演論文集 2006 (0) 109 -110 2006年 [査読無し][通常論文]
     
    前報では,異領域知識の統合を,オントロジーと格文法を用いた知識記述により実現する方法を提案した.しかし異領域知識の統合を多様な領域において柔軟に適用するためには,各設計知識上に現れる領域固有のターミノロジーを管理するための方法を用意する必要がある.本稿ではターミノロジーを一般的な共通オントロジーと多重的に管理することにより,ターミノロジーを取り扱う方法を提案し,実際の設計知識への適用例を示す.
  • Overview of the NTCIR-5 WEB Query Term Expansion Subtask. In Proceedings of the Fifth NTCIR Workshop Meeting on Evaluation of Information Access Technologies, National Institute of Informatics, 2005.
    Masaharu Yoshioka Information Retrieval, Question Answering and Cross-Lingual Information Access 443 -454 2005年12月 [査読無し][通常論文]
  • 吉岡 真治 情報処理学会研究報告. FI,.情報学基礎研究会報告 81 (108) 53 -60 2005年11月02日 [査読無し][通常論文]
     
    検索語拡張手法は、ユーザの持っている検索要求に応じた検索語を初期検索語に追加することにより検索性能を向上させる技術であり、多くのシステムで用いられ、その効果が確認されている。しかし、この手法が検索性能に与える効果は、様々な要因と関係しているため、検索語拡張手法の持つ性質を分析する方法に関しては十分議論されているとはいえない。そこで、本研究では、検索語拡張手法を分析するために、その有用性に影響を与えると考えられる要素の整理を行なう。また、実際の検索実験の結果に基づき、検索語拡張手法の分析を行なう。
  • 吉岡 真治, Yoshioka Masaharu ディジタル図書館 (29) 55 -62 2005年11月 [査読無し][通常論文]
  • 吉岡 真治 情報処理学会研究報告. データベース・システム研究会報告 136 (42) 25 -30 2005年09月19日 [査読無し][通常論文]
     
    多くの情報検索システムの利用者にとって、情報要求を適切に表現する検索語を選択することは必ずしも容易ではない。その結果として、検索要求と検索語の間にギャップが生じることがあり、そのギャップが検索課題の難易度に影響を与えると考えられる。そこで、本論文では、情報検索のテストコレクションにおける検索語の有用性を検討するために有用であると考えられる指標を提案すると共に、検索性能への影響の相関性を調べる。
  • 山田哲弥, 梅田靖, 戸川契, 吉岡真治 IMS研究成果講演論文集 2005 57-60 2005年07月20日 [査読無し][通常論文]
  • MinatoShinichi, YoshiokaMasaharu 情報処理学会研究報告. UBI, [ユビキタスコンピューティングシステム] 2005 (60) 497 -501 2005年06月09日 [査読無し][通常論文]
     
    For tracing or finding the lost goods, we need active-type of RFID tags with built-in batteries, but those active tags have significant drawbacks such as the higher hardware cost and the finite battery lifetime. In this paper, we propose "double-decker" RFID tags, which can be separated into the two parts of ID tags. The new type of RFID tag is useful and cost-effective for tracing/keeping of a large number of goods. We present the basic structures of the double-decker tags and show some typical applications.
  • 吉岡 真治 情報処理学会研究報告情報学基礎(FI) 2005 (42) 25 -30 2005年05月19日 [査読無し][通常論文]
     
    多くの情報検索システムの利用者にとって、情報要求を適切に表現する検索語を選択することは必ずしも容易ではない。その結果として、検索 要求と検索語の間にギャップが生じることがあり、そのギャップが検索課題の難易度に影響を与えると考えられる。そこで、本論文では、情報検索のテストコレクションにおける検索語の有用性を検討するために有用であると考えられる指標を提案すると共に、検索性能への影響の相関性を調べる。In many cases, it is not easy for a user of Information Retrieval (IR) to select appropriate query terms for representing his/her information need. Since this mismatch between query terms and information need affects the topic difficulty, it is better to have a framework to evaluate the effectiveness of the query terms. Therefore, in this paper, I propose some feature quantities that characterize quality of initial query in test collection. I also analyze correlation coefficient between these quantities and retrieval performance by using NTCIR-4 web test collection.
  • 吉岡 真治, Masaharu Yoshioka 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 20 (3) 268 -268 2005年05月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 20 (3) 268 -268 2005年05月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能 20 (3) 268 -268 2005年 [査読無し][通常論文]
  • 森本 憲悟, 鬼城 渉, 下村 芳樹, 吉岡 真治, 武田 英明, 上田 完次 設計工学・システム部門講演会講演論文集 2005 (0) 168 -171 2005年 [査読無し][通常論文]
     
    It is important to unify different knowledge groups, which exist independently, and to extend knowledge gradually in order to obtain creative design solutions that are not obtained only with the existing design knowledge. With the aim of development of "Universal Abduction Studio", which is a system supporting creative design, a knowledge representation and a matching algorithm for creating hypothetic knowledge is proposed in this paper.
  • 吉岡 真治 設計工学・システム部門講演会講演論文集 2005 (0) 334 -337 2005年 [査読無し][通常論文]
     
    Program management aims to support a management for a large and complex project. We have already proposed a framework for supporting this management process by reviewing a program from three different aspects (i.e., process planning, related information, and stake holder networks). However, this system only supports to represent and review a program by using manually inputted information. In this paper, I proposed a system that extract stakeholders information from a text to support constructing stake holder network. In this system, we categorize stakeholders in two types. One is collaborator and the other is opponent. For extracting these two types of stakeholders, we collected typical expression for describing them and made pattern match rule for extraction. For evaluating our methodology, we implemented the prototype system that uses Japanese newspaper articles as a resource for extraction.
  • 鬼城 渉, 森本 憲悟, 下村 芳樹, 吉岡 真治, 武田 英明 年次大会講演論文集 2005 (0) 249 -250 2005年 [査読無し][通常論文]
     
    When a designer confronts a difficult design problem which cannot be solved only with his/her own knowledge, it is necessary to amplify it by introducing new perspectives and ideas for design. The authors have been developing a integrated computer aided design system for creative design. In this report, the authors propose a knowledge description framework which enables computers to analogize a bit of knowledge to another in a different field. Additionally, a tagging method of knowledge by RDF/XML and the implement of an editing tool for the method are mentioned in this report.
  • 吉田 守泰, 吉岡 真治 人工知能学会全国大会論文集 5 (0) 95 -95 2005年 [査読無し][通常論文]
     
    大規模で複雑な事業などの支援を目的としたプログラムマネジメントにおいて、関係する利害関係者を理解することは重要な意味を持つ。本研究では、この情報を、新聞記事などのテキストからパタンを用いて抽出・分類する方法を提案する。
  • 森本 憲悟, 鬼城 渉, 藤本 裕, 下村 芳樹, 吉岡 真治, 武田 英明 人工知能学会全国大会論文集 5 (0) 282 -282 2005年 [査読無し][通常論文]
     
    本稿では,設計における問題解決に有効な仮説的知識を生成するために,概念ネッワークから知識モデルを生成し,そのモデルに対してアナロジーを適用する手法を提案する.さらに実験により本手法の有効性を検証する.
  • 吉田 守泰, 吉岡 真治 人工知能学会全国大会論文集 19 1 -4 2005年 [査読無し][通常論文]
  • 森本 憲悟, 鬼城 渉, 藤本 裕, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2005 (0) 183 -183 2005年 [査読無し][通常論文]
     
    既知の知識のみからでは解を導出困難であるような創造的設計においては、新たな知見の導入や発想により、知識の拡張をすることが必要となる。著者らはこれまでに、創造的設計を総合的に支援する計算機環境の開発を目指し、アナロジーによって複数の異なる知識群間において新たな知識を獲得するための知識統合手法の提案を行ってきた。本報では、知識の意味を考慮した構造的類似性判定を実現するために、深層格による知識表現に基づく概念のマッチング手法を提案する。さらに本手法を実装したプロトタイプにより、その妥当性·有効性を検証する。
  • 鬼城 渉, 森本 憲悟, 藤本 裕, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2005 (0) 182 -182 2005年 [査読無し][通常論文]
     
    既知の知識のみからでは解を導出困難であるような創造的設計においては、新たな知見の導入や発想により、知識の拡張をすることが必要となる。著者らはこれまでに創造的設計を総合的に支援する計算機環境の開発を目指し、前報では、意味に基づく知識処理を実現するための知識スキームを提案した。本報では、前報で提案した知識スキームに基づく、RDF/XMLを用いた知識記述形式の提案を行う。さらに提案形式により知識記述を支援する知識エディタの実装状況を報告する。
  • 森本憲悟, 下村芳樹, 藤本裕, 武田英明, 吉岡真治 精密工学会大会学術講演会講演論文集 2004 A68 2004年09月01日 [査読無し][通常論文]
  • 梅田靖, 田辺繁彦, 戸川契, 吉岡真治 IMS研究成果講演論文集 2004 101-104 2004年07月28日 [査読無し][通常論文]
  • 吉岡 真治, 五十嵐 優 人工知能基本問題研究会 56 (0) 91 -96 2004年07月25日 [査読無し][通常論文]
  • 原口 誠, 吉岡 真治 情報処理学会研究報告. NL,自然言語処理研究会報告 162 (73) 7 -10 2004年07月15日 [査読無し][通常論文]
     
    様々な観点から類似していると判断できる文書群から、文書評に内在する共通性を汎化された共通イベント列(極大類比)として抽出し、極大類比に包摂される任意の文書を関連文書と判断するアクセス手法を考える。極大類比を構成する際に必要な計算量を軽減せしめ、かつ同時に関連性判断の精度を向上させる目的で、所与の質問式Qの具体化で事例文書Iの汎化になっている極大類比に限定した構成法を与える。
  • 近藤伸亮, 石上佳照, 梅田靖, 下村芳樹, 吉岡真治 Designシンポジウム講演論文集 2004 227-230 2004年07月08日 [査読無し][通常論文]
  • 藤本裕, 下村芳樹, 武田英明, 吉岡真治 Designシンポジウム講演論文集 2004 99-104 2004年07月08日 [査読無し][通常論文]
  • 吉岡 真治, 原口 誠 情報処理学会研究報告. FI,.情報学基礎研究会報告 74 (36) 87 -93 2004年03月26日 [査読無し][通常論文]
     
    情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案している。本報では、汎化概念の関連文書における網羅性に注目し、検索に役に立つと考えられる汎化概念を明示化するインタフェースの作成について報告する。また、この網羅性に注目することにより、検索意図をより明確に表現するBoolean検索式の構築の支援とWeb検索への応用についても述べる。
  • 吉岡 真治, 原口 誠 情報処理学会研究報告デジタルドキュメント(DD) 2004 (36) 87 -93 2004年03月26日 [査読無し][通常論文]
     
    情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案している。本報では、汎化概念の関連文書における網羅性に注目し、検索に役に立つと考えられる汎化概念を明示化するインタフェースの作成について報告する。また、この網羅性に注目することにより、検索意図をより明確に表現するBoolean検索式の構築の支援とWeb検索への応用についても述べる。It is not easy for a user of Information Retrieval (IR) system to select appropriate keywords. In this research, we proposed a new IR system that uses adaptive generalization of keywords. When the system can selects appropriate generalization by estimating user's intent, the system can generate good keywords that have high readability and good retrieval performance. In this report, we proposed new IR user interface that displaies generalized concepts by using relevant documents information. In addition, we propose a method to construct Boolean retrieval formula by using these generalized concepts and apply this method for Web information retrieval.
  • 吉岡真治, 原口誠 言語処理学会年次大会発表論文集 10th (CD-ROM) A10C2-01 2004年03月16日 [査読無し][通常論文]
  • 吉岡 真治 人工知能 19 (1) 127 -128 2004年 [査読無し][通常論文]
  • YOSHIOKA Masaharu Working Notes of the Fourth NTCIR Workshop Meeting, Supplement Volume, 2004 2004年 [査読無し][通常論文]
  • 森本 憲悟, 藤本 裕, 下村 芳樹, 武田 英明, 吉岡 真治 設計工学・システム部門講演会講演論文集 2004 (0) 332 -335 2004年 [査読無し][通常論文]
     
    In order to obtain a creative design solution, which is not obtained only with existing design knowledge, it is required to unify different knowledge groups, which exist independently, and to perform gradual extension of knowledge. Authors have proposed some knowledge representations and algorithms of knowledge integration for realizing knowledge extension with the aim of development of "Universal Abduction Studio", which supports creative design synthetically. In this paper, the fundamental framework for dealing with information as knowledge is proposed. And the representation and the knowledge integration based on it are proposed.
  • 武田 英明, 藤本 裕, 吉岡 真治, 下村 芳樹 人工知能学会全国大会論文集 4 (0) 287 -287 2004年 [査読無し][通常論文]
     
    設計情報を計算機によって知的処理させるためには,テキストに機械処理可能なタグ付けをする必要がある.設計の場合,多様な文脈があるため,一意のタグづけは難しい.そこで本研究では,複数の解釈が可能なタグ付け方法を提案し,書籍の文章を例題にタグづけを試験的におこなった.
  • 森本 憲悟, 下村 芳樹, 藤本 裕, 武田 英明, 吉岡 真治 精密工学会学術講演会講演論文集 2004 (0) 45 -45 2004年 [査読無し][通常論文]
     
    既存の設計知識だけでは得られないような創造的な設計解を得るためには、独立
    に存在する異なる知識群を統合し、知識の段階的拡張を行うことが必要である。
    著者らは創造的設計を総合的に支援する環境・UASの構築を目指し、これまでに
    段階的な知識拡張を実現するための、複数の知識表現形式や知識統合の手法を提
    案してきた。本報では自然言語などによって記述された情報を知識として取扱う
    ための基本的枠組みを提案する。
  • 吉岡 真治, 五十嵐 優 人工知能学会全国大会論文集 4 (0) 130 -130 2004年 [査読無し][通常論文]
     
    本研究では、ユーザが持つ問題に対し、類似事例などを提示しながら、問題解決を支援する知識マネージメントシステムの研究を行っている。本報では、オントロジーに基づく概念定義を利用した類似事例の検索と再利用の方法について述べる。
  • 武田 英明, 藤本 裕, 吉岡 真治 人工知能学会全国大会論文集 18 1 -3 2004年 [査読無し][通常論文]
  • 石上 佳照, 近藤 伸介, 梅田 靖, 下村 芳樹, 吉岡 真治 精密工学会学術講演会講演論文集 2004 (0) 297 -297 2004年 [査読無し][通常論文]
     
    アップグレード設計は、単に製品の物理的寿命を延長するだけでなく、機能的寿命を延長する設計手法である。本稿では、機能変更を伴う(e.g. 片面コピー機に二世代目で両面コピー機能を追加)アップグレード設計を扱う。従来、著者らが提案してきたアップグレード設計方法論に基づき、設計支援システムを開発し、実行例を述べ、本方法論の有効性を検証する。
  • 藤本 裕, 野間口 大, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2004 (0) 197 -197 2004年 [査読無し][通常論文]
     
    対象固有の領域知識を用いるだけでは、既存の設計解を改良することは可能であっても創造性の高い設計を支援することは困難である。即ち、創造性の高い設計を支援するためには、異なる領域に属する知識を互いに関連づけることによる問題の再定義や、新しい知識を作成するための手段が必要である。本報では、前報ですでに提案したオントロジーを用いた知識表現の枠組みとその評価結果に基づき、より柔軟な知識利用を実現するための新しい知識表現の手法を提案するとともに、その有効性について検証する。
  • 吉岡 真治 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 19 (1) 127 -128 2004年01月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 18 (3) 367 -368 2003年05月01日 [査読無し][通常論文]
  • 吉岡 真治, Shingi Yoshioka 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 18 (2) 107 -107 2003年03月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能 18 (2) 107 -107 2003年 [査読無し][通常論文]
  • 吉岡 真治 人工知能 18 (3) 367 -368 2003年 [査読無し][通常論文]
  • 吉岡 真治 人工知能 18 (1) 101 -101 2003年 [査読無し][通常論文]
  • 石上 佳照, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治 年次大会講演論文集 2003 (0) 323 -324 2003年 [査読無し][通常論文]
     
    The objective of upgrade design is to extend product life so as to reduce consumption volume of resources and energy usage. However, difficulty of upgrade design resides within prediction of future trend such as technological trends and market trends, and upgrade design should be robusts against uncertainty of future predection. This paper proposes a design methodology for upgradable products, and illustrates a prototype upgrade design support tool which can handle changes of user requirement and market trend. With a design example of a vacuume cleaner, this papar also demonstrates the features of the upgrade design tool.
  • 吉岡 真治, 野間口 大, 藤本 裕, 下村 芳樹, 武田 英明 設計工学・システム部門講演会講演論文集 2003 (0) 189 -191 2003年 [査読無し][通常論文]
     
    Since previous designer may already generate possible combination of existing domain knowledge, it is difficult to design creative solution without creating innovative knowledge. We have already confirmed that combination of existing knowledge from different domain may useful for this process by analyzing design cases. In this paper, we propose methodology to generate hypothetical knowledge for creative design by combining existing knowledge.
  • 武田 英明, 坂井 宏充, 野間口 大, 吉岡 真治, 下村 芳樹, 冨山 哲男 人工知能学会全国大会論文集 3 (0) 183 -183 2003年 [査読無し][通常論文]
     
    本研究の目的は、設計の創造過程を表現し、計算機上で支援する環境を構築することである。設計の創造的活動はアブダクション、特に理論を統合するアブダクションとしてモデル化することができる。理論を統合するアブダクションの実現には多様なアブダクションのスキーマが併せて利用されるが、ここではアナロジーに基づくアブダクションに注目して、アナロジーに基づく知識統合による設計支援システムのプロトタイプを構築した。
  • 原口 誠, 吉岡 真治, 溝江 彰人, 四ッ谷 雅輝 人工知能学会全国大会論文集 3 (0) 189 -189 2003年 [査読無し][通常論文]
     
    類似文書群の中で初めて言葉の重要度と関連性が定まるとの立場から、物語性を考慮した文の重要度に基づく文書汎化手法を提案する。また、汎化の品質向上に寄与する辞書の更新についても実験的検当結果を報告する。
  • 吉岡 真治, 五十嵐 優, 社本 康広 人工知能学会全国大会論文集 3 (0) 93 -93 2003年 [査読無し][通常論文]
     
    本研究では、ユーザが持つ問題に対し、類似事例などを提示しながら、問題解決を支援する知識マネージメントシステムの研究を行う。本報では、問題解決のタスクの種類に関する分析と、その分析に応じて適切な知識の構造化手法について提案する。
  • 八木 宏明, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治 精密工学会学術講演会講演論文集 2003 (0) 257 -257 2003年 [査読無し][通常論文]
     
    製品のアップグレード設計とは、モジュールを追加、交換することにより製品の機能をアップグレードし機能寿命の延命化を図るものであり、機能の陳腐化による廃棄行動を抑制可能である。本稿では、アップグレード時に機能の追加/削除を可能にするアップグレード製品設計の方法論を提案する。具体的には、対象製品の機能·挙動·構造の関係を操作することにより、機能の追加/削除が可能である、追加モジュールおよび世代間で共通のプラットフォームを決定する。
  • 松田 暁, 下村 芳樹, 吉岡 真治, 梅田 靖 精密工学会学術講演会講演論文集 2003 (0) 258 -258 2003年 [査読無し][通常論文]
     
    著者らは,製品の機能的な寿命の延長を実現するための方法であるアップグレード設計方法論の研究を行っている。本研究は、予測された市場の技術動向に対し追従可能であるよう,製品に施す機能的なアップグレードを計画し、その計画を最適に実現可能であるように製品を設計するための方法を与えることを目的とするものであり、製品のアップグレードを効果的に行うためには、製品アップグレードの計画段階でそれによる効果を把握できることが好ましい。本報では、市場に投入される技術の内容、タイミング、製品使用者の指向等に影響される不確実性を考慮した上で、消費者要求の将来予測を行い、それに基づいた製品ラインナップに要求される仕様を把握する方法について提案する。
  • 下村 芳樹, 坂井 宏充, 野間口 大, 吉岡 真治, 武田 英明, 冨山 哲男 精密工学会学術講演会講演論文集 2003 (0) 27 -27 2003年 [査読無し][通常論文]
     
    著者らは設計における創造性の理解とその計算機による支援を目的とする研究を行っており、その一環として統合的推論環境Universal Abduction Studioの開発に着手している。創造性の高い設計支援を実現する一つの鍵は、対象固有の領域知識のみでなく、異なる領域に属する知識を横断的に利用可能とすることであると考えられる。本研究では、異領域の知識を横断的に利用する推論形態としてのAbductionに着目し、これを統合的に実装することにより創造性の高い設計支援のための推論環境を提供するUniversal Abduction Studioの提案を行う。
  • 坂井 宏充, 野間口 大, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2003 (0) 28 -28 2003年 [査読無し][通常論文]
     
    著者らは設計における創造性の理解とその計算機による支援を目的に研究を行っている。創造性の高い設計の支援を考える場合、対象固有の領域知識に留まらず、異なる領域に属する知識を横断的に利用可能とすることが必要である。本研究では、知識間の構造的な類似性を発見する枠組みと、これを創造性の高い設計支援に適用する手法を提案する。特に、知識間の類似性発見の手法について、例題よりその有効性を検証する。
  • 吉岡 真治, 五十嵐 優, 社本 康広 人工知能学会全国大会論文集 17 1 -3 2003年 [査読無し][通常論文]
  • 原口 誠, 吉岡 真治, 溝江 彰人 人工知能学会全国大会論文集 17 1 -3 2003年 [査読無し][通常論文]
  • 藤本 裕, 野間口 大, 下村 芳樹, 吉岡 真治, 武田 英明 精密工学会学術講演会講演論文集 2003 (0) 39 -39 2003年 [査読無し][通常論文]
     
    対象固有の領域知識を用いるだけでは、既存の設計解を改良することは可能であっても創造性の高い設計を支援することは困難である。即ち、創造性の高い設計を支援するためには、異なる領域に属する知識を関連づけることによる問題の再定義や、新しい知識を作成するための手段が必要である。本報では、前報で提案した知識間の類似性を発見する枠組とその評価結果に基づき、より高度な知識利用を実現するための知識表現の枠組みに対する要求仕様を明らかにするとともに、その具体的な実現方法に関して考察する。
  • 吉岡 真治 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 18 (1) 101 -101 2003年01月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 17 (5) 649 -650 2002年09月01日 [査読無し][通常論文]
  • 原口 誠, 中野 卯虎, 吉岡 真治 情報処理学会研究報告. NL,自然言語処理研究会報告 150 (66) 99 -103 2002年07月15日 [査読無し][通常論文]
     
    類似した文書群に共通するイベント系列により文書群を組織化する可能性について論じる。そのために、文の格構造の汎化を要素としてもつ極大類比を導入し、汎化コスト条件を用いた極大類比の発見的検出手法を示す。あわせて、非類似文書とのネガティブマッチングにより、可能な類比を抑制する効率の良い方法も示す。意味処理の困難さに起因する問題点についても触れ、それに関する今後の計画も述べる。
  • 原口 誠, 中野 卯虎, 吉岡 真治 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 102 (200) 1 -5 2002年07月09日 [査読無し][通常論文]
     
    類似した文書群に共通するイベント系列により文書群を組織化する可能性について論じる。そのために、文の格構造の汎化を要素としてもつ極大類比を導入し、汎化コスト条件を用いた極大類比の発見的検出手法を示す。あわせて、非類似文書とのネガティブマッチングにより、可能な類比を抑制する効率の良い方法も示す。意味処理の困難さに起因する問題点についても触れ、それに関する今後の計画も述べる。
  • 吉岡 真治, 原口 誠, 大久保 好章 情報処理学会研究報告. データベース・システム研究会報告 127 (41) 151 -158 2002年05月21日 [査読無し][通常論文]
     
    情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。この問題に対し、検索者の検索意図を推定し、検索者の補完を行う検索システムが提案されている。しかし、補完した結果は複雑であることが多く、検索者が補完結果自体を評価することが困難である。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案する。本報では、概念階層の汎化のレベルを決定するために、検索者により入力された検索語が持つ適合性判定への寄与度を考える。また、本システムの性能を向上させるためには、概念階層自体が目的に応じて再構成されることが必要であることについて述べ、目的指向の概念階層の修正の方法を提案する。
  • 吉岡 真治, 原口 誠, 大久保 好章 情報処理学会研究報告情報学基礎(FI) 2002 (41) 151 -158 2002年05月21日 [査読無し][通常論文]
     
    情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。この問題に対し、検索者の検索意図を推定し、検索者の補完を行う検索システムが提案されている。しかし、補完した結果は複雑であることが多く、検索者が補完結果自体を評価することが困難である。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案する。本報では、概念階層の汎化のレベルを決定するために、検索者により入力された検索語が持つ適合性判定への寄与度を考える。また、本システムの性能を向上させるためには、概念階層自体が目的に応じて再構成されることが必要であることについて述べ、目的指向の概念階層の修正の方法を提案する。It is not easy for a user of Information Retrieval (IR) system to select appropriate keywords. Therefore, many IR systems have capability to modify keywords by estimating user's intent. However, since modified keywords are usually represented as complicated form, it is difficult to judge the appropriateness of them. In this research, we proposed a new IR system that uses adaptive generalization of keywords. When the system can selects appropriate generalization by estimating user's intent, the system can generate good keywords that have high readability and good retrieval performance. In this report, we proposed to use the contribution value of each keyword for relevance judgement to select appropriate generalization. In addition, we confirm general concept structure stored in a thesaurus is not sufficient for representing particular user's intent. Therefore, we proposed a purpose oriented method to modify concept structure.
  • 竹内孔一, 内山清子, 吉岡真治, 影浦峡, 小山照夫 情報処理学会論文誌 43 (5) 1446 -1456 2002年05月15日 [査読無し][通常論文]
     
    本研究では,主辞がサ変名詞である複合名詞の語構成において,構成する単語間の係り関係を支配する語彙的性質に着目し,それに基づく複合名詞解析モデルの作成を試みる.主辞がサ変名詞の複合名詞内の係り関係の解析は,並列関係の場合を除くと,主辞であるサ変名詞の項関係なのか修飾なのかを同定することが解析の第1歩である.項関係とは名詞が動詞の目的語や主語といった関係であることを意味している.本論文では,この関係をとらえる方法として,語彙概念構造を利用した動詞の分類と,その構造を利用した名詞の分類に基づく複合名詞解析手法を提案する.情報処理関連の専門用語と新聞記事中の一般的な複合名詞に対してテスト的な実験を行った.その結果,平均で1231語の複合名詞対して約99.4%の複合名詞を正しく解析する結果を得た.
  • 吉岡 真治, 神門 典子, Masaharu Yoshioka, Noriko Kando 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 17 (3) 295 -295 2002年05月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence 17 (3) 372 -373 2002年05月01日 [査読無し][通常論文]
  • 栗山和子, 吉岡真治, 神門典子 情報処理学会論文誌. データベース 43 (2) 48 -59 2002年03月15日 [査読無し][通常論文]
     
    大規模テストコレクションNTCIR-2の正解文書リストは,NTCIR ワークショップ2において各参加者から提出された検索結果を用いて,プーリング法に基づいて作成された.本稿では,NTCIR-2の正解文書リストの作成過程において行われた,言語横断的プーリング,および対話型検索システムを用いた追加検索が,検索システムのNTCIR-2を用いた相対的評価にどのような影響を与えるかを考察する.また,プーリングに参加しなかったシステムを評価する場合に,プーリング法で作成したNTCIR-2が有効であるかどうか調べる.本研究では,NTCIR-2の正解文書リストと,NTCIR ワークショップ2の参加チームの提出結果を用いて評価実験を行った.まず,最終的な正解文書リスト Fと,Fから追加の対話型検索Iだけで見つかった文書を除いた正解文書リストF-Iを用いて、提出結果の評価を行った.次に,各サブタスクごとの提出結果からプーリングを行い,このサブタスクごとのプールを正解文書リストとして用いた場合の評価を行った.さらに,プーリングに参加しなかったシステムの評価をシミュレートするため,Fから同じシステムの提出結果の集合だけに含まれている正解文書Sを除いた正解文書リストF-Sを用いて,そのシステムの提出結果を評価した.いずれの場合でも,提出結果の平均精度の平均による順位付けを行い,相対的評価とした.結果と...
  • 梅森 嘉匡, 八木 宏明, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治 精密工学会大会学術講演会講演論文集 2002 (1) 138 -138 2002年03月01日 [査読無し][通常論文]
  • 吉岡 真治 人工知能 17 (5) 649 -650 2002年 [査読無し][通常論文]
  • 吉岡 真治 人工知能 17 (3) 372 -373 2002年 [査読無し][通常論文]
  • 小川 泰嗣, 佐々木 裕, 増山 繁, 村田 真樹, 吉岡 真治 人工知能 17 (3) 306 -311 2002年 [査読無し][通常論文]
  • 石上 佳照, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治 設計工学・システム部門講演会講演論文集 2002 (0) 56 -59 2002年 [査読無し][通常論文]
     
    Upgrade design is one of the usefull approaches to realize inverse manufacturing because upgrade design can extend product lives and reduce consumption volume of resources and energy usage. However, difficulty of upgrade design resides within prediction of future trend such as technological trends and market trends. This papar propose a design method for upgradable products, and prototype design support tool which can be adapted changes of user requirement and market trend. Using design example of vacuume cleaner, this papar demonstrates that this support tools is effective for designing upgradable products.
  • 坂井 宏充, 野間口 大, 吉岡 真治, 武田 英明, 下村 芳樹, 冨山 哲男 設計工学・システム部門講演会講演論文集 2002 (0) 410 -411 2002年 [査読無し][通常論文]
     
    Although design support systems have been well developed in geometric and detail design areas, they are still not successful in conceptual or creative design domain. In our opinion, the main difficulty is knowledge and its operation that play a crucial role in conceptual design. In this paper, we propose "Universal Abduction Studio" that is a new approach to support designers by computers, and discuss technologies to realize it.
  • 吉岡 真治, 五十嵐 優, 社本 康広 人工知能学会全国大会論文集 2 (0) 142 -142 2002年 [査読無し][通常論文]
  • 吉岡 真治, 五十嵐 優, 社本 康広 人工知能学会全国大会論文集 16 1 -4 2002年 [査読無し][通常論文]
  • 野間口 大, 吉岡 真治, 冨山 哲男 人工知能学会論文誌 17 (17) 104 -113 2002年 [査読無し][通常論文]
     
    In this paper, we propose a fundamental idea of a new CAD mechanism to facilitate design knowledge management. This mechanism encourages a designer to externalise his/her knowledge during a design process and facilitates sharing and reuse of such externalised design knowledge in later stages. We also describe the implementation of this idea called DDMS (Design Documentation Management System). DDMS works as a front end to KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the features of DDMS.
  • 栗山 和子, 吉岡 真治, 神門 典子 情報処理学会研究報告. FI,.情報学基礎研究会報告 63 (74) 9 -16 2001年07月24日 [査読無し][通常論文]
     
    大規模テストコレクションNTCIR-2の構築において、正解文書リストは、プーリング法に基づいて作成された。本稿では、NTCIR-2の正解文書リストの作成過程で行なった言語横断的プーリングおよび対話型検索システムを用いた追加検索が、NTCIR-2を使用した検索システムの評価に与える影響をついて考察する。本研究では、NTCIR-2の正解文書リストと、NTCIRワークショップ2の参加チームの提出結果を用いて評価実験を行なった。まず、NTCIR-2の最終的な正解文書リストFと、Fから追加の対話型検索Iだけで見つかった文書を除いたリストF-Iを用いて、提出結果の評価を行なった。次に、各サブタスクごとの提出結果からのプーリングを行ない、このサブタスクごとのプールを正解文書リストとして評価を行なった。結果として、いずれの文書リストを正解文書リストとして提出結果の評価を行なっても、提出結果の相対的な順位はほとんど変化せず、プーリング法に基づいて作成したテストコレクションの信頼性を確かめることができた。
  • 神門 典子, 栗山 和子, 吉岡 真治 情報処理学会研究報告. FI,.情報学基礎研究会報告 63 (74) 105 -112 2001年07月24日 [査読無し][通常論文]
     
    本稿では、多段階レレバンス判定に適応できる新しい情報検索システムの検索有効性評価指標を提案する。検索された文書の検索質問への適合性(レレバンス)判定は、検索有効性評価のもっとも基本的な要素の1つである。検索では、通常、より適合性の高い文書がより早く(より上位のランクで)検索されることが望ましい。しかしながら, 従来、検索有効性を示す精度と再現率は、「適合」「不適合」の二値判定に基づいて算出され、「より適合性が高い」という側面を評価できなかった。テストコレクションを用いる情報検索システムの実験室型評価では、多数の検索を行い、それぞれの評価値を平均することで安定した評価が可能である。そこで、本稿では、既存の検索有効性指標の特性を検討し、それを踏まえ、扱いやすい単一の平均可能な指標として、重み付きR精度と重み付き平均精度を提案し、「高適合」、「適合」、「部分的適合」、「不適合」の4段階レレバンス判定を採用した第2回NTCIRワークショップの日本語検索タスクの提出結果を評価した例をしめす。最後に、多段階レレバンス判定による評価と、利用者指向の検索システム評価との関連にも言及する。
  • The effect of cross-lingual pooling on evaluation
    Kuriyama,K, Yoshioka, M, Kando, N Proceedings of the Second NTCIR Workshop on Research in Chinese & Japanese Text Retrieval and Text Summarization., Tokyo, Japan, May 2000-March 2001, National Institute of Informatics 297 -310 2001年07月 [査読無し][通常論文]
  • Overview of Japanese and English Information Retrieval Tasks (JEIR) at the Second NTCIR Workshop
    Kando, N, Kuriyama, K, Yoshioka, M Proceedings of the Second NTCIR Workshop on Research in Chinese & Japanese Text Retrieval and Text Summarization, Tokyo, Japan, May 2000-March 2001, National Institute of Informatics 73 -96 2001年07月 [査読無し][通常論文]
  • Analysis of the usage of Japanese segmented texts in NTCIR Workshop 2
    Yoshioka, M, Kuriyama, K, Kando, N Proceedings of the Second NTCIR Workshop on Research in Chinese & Japanese Text Retrieval and Text Summarization., Tokyo, Japan, May 2000-March 2001, National Institute of Informatics 291 -296 2001年07月 [査読無し][通常論文]
  • 下村芳樹, 吉岡真治, さい剛民, 梅森嘉匡, 梅田靖 精密工学会大会学術講演会講演論文集 2001 365 2001年03月05日 [査読無し][通常論文]
  • 人と情報システムとのシンビオシスのための情報検索および情報活用支援に関する研究 -- Web文書検索を中心として--
    栗山和子, 吉岡真治, 江口浩二, 岸田和明, 神門典子, 影浦峡, 高野明彦, 大山敬三, 安達淳 COEプロジェクト平成12年度報告書『シンビオティック情報システムへの概念形成と実現技術』, 国立情報学研究所,2001 47 -54 2001年03月 [査読無し][通常論文]
  • YOSHIOKA Masaharu Proceeding of the 2001 ASME Design Engineering Technical Conference & Computers and Information in Engineering Conference 2001年 [査読無し][通常論文]
  • 吉岡 真治, 武田 英明, 鷲尾 隆, 冨山 哲男 設計工学・システム部門講演会講演論文集 2001 (0) 281 -284 2001年 [査読無し][通常論文]
     
    Since design knowledge plays a crucial role in design process, we are conducting research on design reasoning model that takes notice of design knowledge. To make a design reasoning model, we have already proposed a reasoning framework of design and analyzed basic operations for the framework. However, since these operations are just fragments of whole design process, it is necessary to describe design operational knowledge that can control the entire reasoning operations by constructing the sequence of these fragments. So, in this paper, we propose a synthesis language for describing design operational knowledge.
  • 野間口 大, 妻屋 彰, 吉岡 真治, 鷲尾 隆, 武田 英明, 村上 存, 冨山 哲男 設計工学・システム部門講演会講演論文集 2001 (0) 285 -288 2001年 [査読無し][通常論文]
     
    Since design knowledge plays a crucial role in design process, we are conducting research on design reasoning model that takes notice of design knowledge. To make a design reasoning model, we have already proposed a reasoning framework of design and analyzed basic operations for the framework, and then propose a synthesis language for describing design operational knowledge. In this paper, we propose our implementation of this model, and verify it to compare design processes replayed in the system with ones of actual design sessions.
  • 妻屋 彰, 野間口 大, 吉岡 真治, 武田 英明, 村上 存, 冨山 哲男 設計工学・システム部門講演会講演論文集 2001 (0) 289 -292 2001年 [査読無し][通常論文]
     
    In engineering design research, numerous design process models have already been proposed. For constructing model of synthesis, it is very important to know the position of the model among them. This paper reports results of comparison of some design process models with the synthesis oriented thought process model. We use a reference model as an example of design, compare it with some existing design process models, and the results of this analysis are described.
  • 野間口 大, 吉岡 真治, 冨山 哲男 設計シンポジウム講演論文集 2001 (19) 109 -116 2001年 [査読無し][通常論文]
     
    In this paper, we propose a fundamental idea of a new CAD architecture to facilitate design knowledge management. This architecture is based on knowledge-based design environment for encouraging the designer to externalize his/her knowledge. We also discuss the implementation of this idea. DDMS (Design Documentation Management System) works as a front end for KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the system's features.
  • 坂井 宏充, 野間口 大, 吉岡 真治, 下村 芳樹, 冨山 哲男 設計工学・システム部門講演会講演論文集 2001 (0) 204 -206 2001年 [査読無し][通常論文]
     
    In engineering activities, management of designers' knowledge is becoming crucial to share and reuse it efficiently. Toward this issue, we are studying a methodology to capture the designer's thought process, and to semi-automatically arrange it into a refined document, which addresses a particular objective with particular thought patterns. The key issues of this methodology are to acquire the thought patterns and to define relations among them. This paper reports our algorithm to acquire thought patterns from a record of designer's thought processes and any other types of documents including patent documents and academic papers. We employ a knowledge discovery approach which is recently discussed in data mining research.
  • 梅森 嘉匡, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治 設計工学・システム部門講演会講演論文集 2001 (0) 269 -272 2001年 [査読無し][通常論文]
     
    Conventional products tend to be thrown away because of functional obsoleteness before reaching the end of physical life of the products. This is one of the main causes of the mass disposal problem. In order to solve this problem, this paper proposes a design methodology for upgradable products. Especially, this paper discusses a method dealing with uncertainty of long-term planning in the design methodology. The proposed method deals with uncertainty as ranges of parameter values, and derives a design solution that realizes required upgrades, while adapting to estimated uncertainty. This method makes a design object robust and tolerant against the uncertainty and, therefore, makes design for upgradability more feasible.
  • 吉岡 真治, 社本 康広 設計工学・システム部門講演会講演論文集 2001 (0) 321 -324 2001年 [査読無し][通常論文]
     
    In engineering activities, engineers solve various kinds of problems. Most of these problems are routine problems that are easy to formalize and formalized knowledge is useful for these problems. On the other hand, there are complicated problems that is difficult to formalize all of the problem solving process. One of the useful information to solve such complicated problems is result of the similar problem solving process. In addition, later in such complicated problem solving process, most of the decomposed subproblems are able to handle as routine problems. In this research, we decide to use formalized knowledge and document information that represents the history of problem solving processes to support to solve both types of the problem. For that purpose, we propose a new knowledge management system that supports a user to solve the problem through document processing. In this support process, the system retrieves related documents for user's problems by using formalized knowledge and information retrieval techniques. After retrieving related documents, he/she modifies them to fit his/her problems. Modified information is associated with the formalized knowledge and stored as documents for future reuse.
  • 武田 英明, 吉岡 真治, 冨山 哲男 人工知能学会全国大会論文集 1 (0) 30 -30 2001年 [査読無し][通常論文]
  • 武田 英明, 吉岡 真治, 冨山 哲男 人工知能学会全国大会論文集 15 1 -4 2001年 [査読無し][通常論文]
  • 栗山 和子, 吉岡 真治, 神門 典子 情報処理学会研究報告. FI,.情報学基礎研究会報告 60 (91) 9 -16 2000年09月27日 [査読無し][通常論文]
     
    本稿では、大規模テストコレクションNTCIR-1とNTCIR-2および、NTCIRワークショップ2について紹介し、NTCIR-1とNTCIR-2の文書レコードから見た違いについて述べる。具体的には、レコードの長さ、その分布、異なり語数、その頻度などから、NTCIR-1と2の違いについて考察する。
  • 栗山 和子, 吉岡 真治, 神門 典子 ディジタル図書館 18 (18) 57 -64 2000年09月 [査読無し][通常論文]
  • 栗山和子, 吉岡真治, 神門典子, Kuriyama kazuko, Yoshioka Masaharu, Kando Noriko, クリヤマカズコ, ヨシオカマサハル, カンドノリコ ディジタル図書館 (18) 57 -64 2000年09月 [査読無し][通常論文]
  • 吉岡 真治, 武田 英明, 妻屋 彰, 村上 存, 冨山 哲男 精密工学会大会学術講演会講演論文集 2000 (2) 259 -259 2000年09月01日 [査読無し][通常論文]
  • 野間口 大, 妻屋 彰, 吉岡 真治, 武田 英明, 村上 存, 冨山 哲男 精密工学会大会学術講演会講演論文集 2000 (2) 260 -260 2000年09月01日 [査読無し][通常論文]
  • 武田 英明, 吉岡 真治, 冨山 哲男 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 14 (0) 464 -467 2000年07月03日 [査読無し][通常論文]
  • 吉岡 真治, 武田 英明, 冨山 哲男 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 14 (0) 468 -471 2000年07月03日 [査読無し][通常論文]
  • 竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫 情報処理学会研究報告. FI,.情報学基礎研究会報告 57 (29) 71 -78 2000年03月21日 [査読無し][通常論文]
     
    我々は制約に基づく複合語解析モデルの構築を目指している.2単語からなる動詞を主辞にもつ複合語(動詞由来複合語)は前項の単語が主辞(後項)のサ変動詞に対して修飾的な働きを示す付加詞なのか, 主辞の内項(argument)に当たるのかを解析することが複合語の解析につながる.我々は文法的枠組として項構造, 語彙概念構造を用いてサ変動詞を分類した.しかし, 複合語の解析に当たって, 前項の単語(名詞, 形容動詞, サ変動詞)と主辞(サ変動詞)との関係が修飾か内項かの関係をほぼ決定するので, 名詞に対する分類が必要である.そこで, 本論文では, サ変動詞の項構造, 語彙概念構造を基にして, 名詞の分類を行ない, これを用いて複合語解析モデルの構築を目指す.分類には, 生成語彙の特質構造も利用した.分類をもとに制約を仮定し, 情報処理用語辞典から取り出した2単語からなる動詞由来複合語について入手による解析実験を行なった.その結果103語の複合語のうち, 92個(89%)の複合語を制約で解析することができた.この結果を受けて, 現段階でのモデルの限界について議論する.
  • 竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫 情報処理学会研究報告. 自然言語処理研究会報告 2000 (29) 71 -78 2000年03月21日 [査読無し][通常論文]
     
    我々は制約に基づく複合語解析モデルの構築を目指している.2単語からなる動詞を主辞にもつ複合語(動詞由来複合語)は前項の単語が主辞(後項)のサ変動詞に対して修飾的な働きを示す付加詞なのか, 主辞の内項(argument)に当たるのかを解析することが複合語の解析につながる.我々は文法的枠組として項構造, 語彙概念構造を用いてサ変動詞を分類した.しかし, 複合語の解析に当たって, 前項の単語(名詞, 形容動詞, サ変動詞)と主辞(サ変動詞)との関係が修飾か内項かの関係をほぼ決定するので, 名詞に対する分類が必要である.そこで, 本論文では, サ変動詞の項構造, 語彙概念構造を基にして, 名詞の分類を行ない, これを用いて複合語解析モデルの構築を目指す.分類には, 生成語彙の特質構造も利用した.分類をもとに制約を仮定し, 情報処理用語辞典から取り出した2単語からなる動詞由来複合語について入手による解析実験を行なった.その結果103語の複合語のうち, 92個(89%)の複合語を制約で解析することができた.この結果を受けて, 現段階でのモデルの限界について議論する.
  • 竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫 学術情報センター紀要 12 (12) 7 -15 2000年03月 [査読無し][通常論文]
     
    複合語内の語構成を解析する手法として,従来より単語間の共起頻度を利用するモデルが提案されている.しかし,複合語内の語構成は文法的かつ意味的な制約が存在するために,単純な共起による解析モデルには限界がある.最近,形態論や統語論で語のレベル,項構造,語彙概念構造という文法的要素が提案されており,一定の成果が上がっている.本論文では,これらの文法的知識を利用することで,複合語の語構成における制約がどの程度記述できるかを明らかにする.解析の対象として,複合語はサ変名詞を主辞に含む2単語からなる情報処理用語を中心的に取り上げた.考察の結果から,1)2単語間の係関係は修飾かサ変名詞の項の2種の関係に整理できること,2)サ変名詞の項構造が係関係を決定すること,3)文脈により複合語の語構成が変化することが明らかとなった.これらの結果をもとに,複合語解析モデル作成のための考察を行なう.
  • 吉岡 真治, 妻屋 彰, 冨山 哲男, 武田 英明 精密工学会大会学術講演会講演論文集 2000 (1) 18 -18 2000年03月01日 [査読無し][通常論文]
  • 武田 英明, 吉岡 真治, 妻屋 彰, 冨山 哲男 精密工学会大会学術講演会講演論文集 2000 (1) 19 -19 2000年03月01日 [査読無し][通常論文]
  • 妻屋 彰, 野間口 大, 吉岡 真治, 武田 英明, 村上 存, 冨山 哲男 精密工学会大会学術講演会講演論文集 2000 (1) 20 -20 2000年03月01日 [査読無し][通常論文]
  • 今川 晴紀, 下村 芳樹, 吉岡 真治, 梅田 靖 精密工学会大会学術講演会講演論文集 2000 (1) 96 -96 2000年03月01日 [査読無し][通常論文]
  • 下村芳樹, 今川晴紀, 吉岡真治, 梅田靖 日本機械学会設計工学・システム部門講演会講演論文集 9th 501 -504 1999年11月19日 [査読無し][通常論文]
  • 竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 99 (387) 7 -14 1999年10月25日 [査読無し][通常論文]
     
    複合語を解析するモデルを作成するために,複合語を構成する語基に対してどのような背景知識を用意すればよいのであろうか.本論文では,形態論や統語論で用いられている,語のレベル,項構造,語彙概念構造を用いて,サ変名詞を含む2語基からなる専門用語を中心に解析を人手で行なった.解析とは2語基間の係り関係の把握を意味している.この解析の結果,起こり得ない語構成の説明や,複合語自体の品詞が変わる現象を一部説明することができた.今回利用した要素はサ変名詞の動詞的要素を記述するために用意した.本文中ではサ変名詞中心に複合語を解析した場合に,名詞に対してどのような記述をすれば良いかも考察して行く.
  • 吉岡 真治, 野間口 大, 冨山 哲男 情報処理学会研究報告 99 (88) 63 -68 1999年10月21日 [査読無し][通常論文]
     
    設計者は一つのものを設計する過程において、様々な情報や知識を利用して、設計解の選択や設計解の評価と言った判断を下していく。この様な判断の過程で生み出される情報は、その設計解に至った理由を理解するためだけではなく、設計者の持つ知識が反映された再利用可能な有益な情報であると考えられる。そのため、様々な企業で、設計過程の情報を設計文書として蓄積する事が行われている。しかし、実際の設計文書の作成は、設計作業が終了してから説明のために作成されることが多く、情報の欠落などが起りやすい。また、これらの文書は紙や光ディスクなどで蓄積されているが、あまり有効な再利用の枠組みが用いられていない。そこで、我々は、この設計文書を管理する枠組みとして、設計を進めながら同時に設計文書の作成を行うことができ、設計の文脈に応じた設計文書の検索と再利用が可能である設計文書作成管理システムを提案している。本報では、この設計文書作成管理システムの日本語化と全文検索技術の応用について述べる。
  • 内山 清子, 竹内 孔一, 吉岡 真治, 影浦 峡, 小山 照夫 電子情報通信学会技術研究報告. TL, 思考と言語 99 (237) 7 -12 1999年07月26日 [査読無し][通常論文]
     
    情報を検索するためのキーワードは専門分野の複合名詞が多く用いられる。複合名詞の内部構造を解析することにより、複合語生成のメカニズムを明らかにすることができる。従来、複合名詞を構成している語基の意味的関係を中心に解析が行われてきたが、形態的、文法的特性も重要な役割を果たしていると考えられる。本研究では、複合語を解析する時に従来の品詞では扱えなかった部分 (特に名詞) に関する文法的特性について、格助詞の接続パターンによる独自の品詞相当カテゴリーを設定した。そして、複合語を構成している語基間の係り受け関係や結合関係を品詞相当カテゴリーによる文法的特性を用いて考察する。
  • 吉岡 真治 学術情報センター紀要 11 (11) 27 -31 1999年03月 [査読無し][通常論文]
     
    論文には、解説論文、新しい技術を提案している論文、既存の技術を適切に応用した結果を報告した論文など様々なタイプの論文が有り、検索要求によって、適切なタイプの論文が異なると考えられる。よって、本研究では、様々なタイプの論文を区別するために、著者が付けたキーワードをその役割毎に分類するための方法論の提案を目標とする。そのために、本研究では、キーワードの役割はキーワードと共に用いられる動詞に強く関係すると考え、文章中における動詞とキーワードの関係の情報を用いた分類方法の提案を目標とする。本稿では、この分類方法を提案するにあたり、実際の論文のデータに基づいて、キーワードの役割を特徴づけるための動詞についての考察を行い、その結果に基づいて実際にキーワードの役割分類の実験を行ったので、それについて報告する。
  • 内山 清子, 竹内 孔一, 吉岡 真治, 影浦 峡, 小山 照夫 学術情報センター紀要 11 (11) 49 -57 1999年03月 [査読無し][通常論文]
     
    専門分野における複合名詞を分析する時に、複合名詞を構成している語構成要素の情報が必要となってくる。本研究では、語構成要素の文法情報だけでどこまで複合名詞の性質を分析することができるかどうかを見きわめるために、語構成要素を文法情報である品詞相当カテゴリーに分類するための検討を行った。語構成要素においては、従来の文/単語関係で定義された品詞カテゴリーをそのまま適用することは難しい。そこで本研究では、従来の品詞カテゴリーを参照しつつ、新たに語構成用の品詞相当カテゴリーとその定義を設定することを試みた。
  • 吉岡 真治, 岡田 真穂, 影浦 峡, 小山 照夫 情報処理学会研究報告. FI,.情報学基礎研究会報告 53 (20) 41 -48 1999年03月01日 [査読無し][通常論文]
     
    学術情報センター(NACSIS)では、NACSISテストコレクションの一環として、専門用語抽出・解析処理を特に考慮したNACSISコーパスを作成している。このコーパスでは、専門用語に関する処理の中心である語彙的処理を考慮する必要があり、語彙単位の明確化が重要な課題となる。そこで、本稿では、これらの問題に対応するためのNACSISコーパスの設計指針について述べる。さらに、本コーパスの作成状況と、その公開に関する状況について述べる。
  • 関谷 貴之, 吉岡 真治, 冨山 哲男 人工知能 14 (6) 1051 -1060 1999年 [査読無し][通常論文]
     

    During design, a designer uses various computational tools, such as a geometric modeling system, analysis tools, and databases. To support these design processes, a system that can integrate such computational tools is required. For this purpose, we have been developing the Knowledge Intensive Engineering Framework (KIEF) system. KIEF enables the designer to build, evaluate, and modify design models on the system by providing him/her with a wide variety of engineering knowledge. A common ontology plays an important role in integrating tools and representing engineering knowledge. This paper describes the structure of the ontology in KIEF, and how it is used in a modeling processes on KIEF.

  • 吉岡 真治 学術情報センター紀要 10 (0) 73 -79 1998年03月 [査読無し][通常論文]
     
    近年の資源の有限性に関する問題や環境問題などのために、製造業に携わる人々は、各々が作る製品をより多くの様々な観点から評価する事が求められている。これらの問題に対応するために、我々は、製品のライフサイクル(設計・生産・保守・リサイクルなど)に関連する情報や必要な知識を柔軟かつ統合的に利用可能とする知識集約型工学(Knowledge Intensive Engineering)を提案しており、その計算機上へ実現したシステムであるKnowledge Intensive Engineering Framework(KIEF)システムを作成している。本論文では、まず、知識集約型工学およびKIEFシステムについて述べる。さらに、このKIEFシステムの有効性を検討するために本システムの建築設計への応用を試みる。そのために、建築設計に関する知識をどの様に本システム上の知識として表現できるかについて考察する。最後に、現在KIEFシステム上に構築中の知識ベースについて述べ、KIEFシステムの有効性について議論する。
  • 吉岡 真治 学術情報センター紀要 (10) 73 -79 1998年03月 [査読無し][通常論文]
  • 吉岡 真治, 冨山 哲男 人工知能 13 (2) 312 -319 1998年 [査読無し][通常論文]
     

    In this study, we propose a framework of an integrated modeling environment for design. Since a mechanical engineering design process requires various kinds of design object models, such as a geometric model, a kinematic model, and a finite element model, this environment should maintain consistency among these models. Furthermore, commercial design tools are practically used in design processes, and these must be integrated as well. For dealing with multiple design object models, we have formalized a concept called a metamodel. A metamodel is a model which represents relationships among concepts used in various design object models. This paper proposes a framework of the pluggable metamodel mechanism that allows to plug in existing design tools, to support a modeling on it, and to maintain consistency among them. We describe a prototype system and illustrate an example of ball screw design.

  • Y Umeda, M Ishii, M Yoshioka, Y Shimomura, T Tomiyama AI EDAM-ARTIFICIAL INTELLIGENCE FOR ENGINEERING DESIGN ANALYSIS AND MANUFACTURING 10 (4) 275 -288 1996年09月 [査読無し][通常論文]
     
    The relative significance of conceptual design to basic design or detail design is widely recognized, due to its influential roles in determining the product's fundamental features and development costs. Although there are some general methodologies dealing with functions in design, virtually no commercial CAD systems can support functional design, in particular so-called synthetic phase of design. Supporting the synthetic phase of conceptual design is one of the crucial issues of CAD systems with function modeling capabilities. In this paper, we propose a computer tool called a Function-Behavior-State (FBS) Modeler to support functional design not only in the analytical phase but also in the synthetic phase. To do so, the functional decomposition knowledge and physical features in the knowledge base of the modeler, and a subsystem Qualitative Process Abduction System (QPAS) play crucial roles. Modeling scheme of function in relation with behavior and structure and design process for conceptual design in the FBS Modeler are described. The advantages of the FBS Modeler are demonstrated by presenting two examples; namely, an experiment in which designers used this tool and the design of functionally redundant machines, which is a new design methodology for highly reliable machines, as its application.
  • 吉岡 真治, 冨山 哲男 精密工学会大会学術講演会講演論文集 1996 (1) 5 -6 1996年03月01日 [査読無し][通常論文]
  • 石井 理貴, 関谷 貴之, 吉岡 真治, 冨山 哲男 精密工学会大会学術講演会講演論文集 1995 (2) 9 -10 1995年09月01日 [査読無し][通常論文]
  • 吉岡 真治, 中村 雅彦, 冨山 哲男, 吉川 弘之 日本機械学会論文集C編 61 (581) 330 -337 1995年 [査読無し][通常論文]
     
    An intelligent CAD system aims at serving a designer as an intelligent, integrated design environment. For building such a system, development of a large scale knowledge base is necessary. To do so, design knowledge must be systematically formalized, made computable, and organized. Design knowledge has two categories ; i.e., design object knowledge and design process knowledge. In our previous reports, we have formalized a computable design process model to represent design process knowledge and the concept of a metamodel dealing with multiple design object models. This paper proposes a framework to achieve a harmonized combination of these two. In this framework, the computable design process model navigates the metamodel mechanism to generate and modify models of the design object. We describe a prototype system and illustrate an example of ship design.
  • 吉岡 真治, 石井 理貴, 冨山 哲男 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 8 (0) 335 -338 1994年06月20日 [査読無し][通常論文]
  • 石井 理貴, 吉岡 真治, 冨山 哲男 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI 8 (0) 339 -342 1994年06月20日 [査読無し][通常論文]
  • 吉岡 真治, 富山 哲男 東京大学工学部総合試験所年報 (52) p177 -182 1993年09月 [査読無し][通常論文]

受賞

  • 2015年06月 人工知能学会 人工知能学会 研究会優秀賞
     複数国の新聞からの多観点比較による分析~GDELTデータを用いた分析~ 
    受賞者: 吉岡真治;神門典子

共同研究・競争的資金等の研究課題

  • 解説型ウェブページの分かり易さ・見易さの自動評定とそれを用いたページ推薦システム
    日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2019年04月 -2022年03月 
    代表者 : 宇津呂 武仁, 吉岡 真治, 乾 孝司, 亀田 能成
  • 多様なニュースサイトの比較による報道スタンスの分析と可視化の研究
    日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2018年04月 -2022年03月 
    代表者 : 吉岡 真治, 伊藤 正彦, 神門 典子
     
    本年度は、本研究の分析の基盤となる報道スタンスについて、特定のスタンスに属するサイトにおける特徴語について検討するとともに、単純な賛否のみに注目した分析だけでなく、ニュース記事の分類に基づいたスタンスの詳細化を行う方法を提案した。本手法では、ニュース記事の分類と賛否の情報を組み合わせることで、外交には賛成だが、経済では反対といった、より、詳細なスタンス分析が可能となる。本手法は、ユーザの興味(経済には興味はあるが外交には興味がない)と組み合わせることにより、興味に応じたスタンスの分析などに発展することが期待できる。 また、ニュース記事の賛否情報を含むメタデータのデータベースであるGDELTにおいて、不足している本文の情報について、可能な限り収集する枠組を構築し、本研究で用いるデータベースの拡充も行なっている。さらに、GDELTについている賛否情報について、その妥当性を検証するとともに、必要に応じた、再評価を行うために、深層学習による意見分析システムについても実装をはじめ、その有用性を検討している。 また、ニュース記事中の固有名詞とそのタイプを扱うために、Wikipediaのカテゴリ情報に注目した名前付き実体の分類のためのオントロジー構築についても、並行して研究を行なっている。このオントロジーとWikipediaのページのリダイレクトの情報を利用した異表記に関する知識を作成することで、名前付き実体の異表記を取りまとめて扱う方法についても検討を行なっている。
  • 専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの研究
    日本学術振興会:科学研究費助成事業 挑戦的研究(萌芽)
    研究期間 : 2019年06月 -2021年03月 
    代表者 : 吉岡 真治, 原 真二郎, 鈴木 晃
  • 利用者の状況を考慮する探索的検索の技術
    日本学術振興会:科学研究費助成事業 基盤研究(A)
    研究期間 : 2016年04月 -2020年03月 
    代表者 : 神門 典子, 吉岡 真治, 山本 岳洋, 酒井 哲也, 相澤 彰子, 大島 裕明
     
    (1)ユーザの状況の捕捉: ユーザ実験によって収集したインタラクションデータ(検索行動ログ、視線、検索前後のアンケート・コンセプトマップ・インタビューなど)を用い、検索過程における個々のユーザの状況の捕捉を研究した。タスクの認知的複雑さ(Complexity)、背景知識、タスクの自覚する困難さや満足度との関係を解析した。対象は、法律・学術における「調査」、Web、音楽を取り上げた。中国・清華大の協力により、モバイル端末を用いた検索インタラクションとユーザ背景知識、香港大学の協力により音楽検索などの「楽しみのための探索的検索Search for fun」とタスクの認知的複雑性の影響について検討した。さらに新たなインタラクション環境として、美術館博物館の来館者のタブレット端末を用いたデジタル空間での探索行動と実空間での探索閲覧行動の両面を補足し、それらを用いてよりよい探索エクスペリエンス提供を目指すすサブ課題に着手した。
    (2)ユーザの状況に応じて、ユーザを支援する技術:異なる認知的複雑さタスクを選定し、検索過程でユーザを支援する技術のプロトタイプを提案した。具体的には (a)クエリマイニングによる代替検索戦略提案:コミュニティQAコーパスの質問・解答構造を利用して、同じ検索意図や目的のための異なる検索戦略をユーザに提示、(b)マルチファセット検索UIのベースラインシステムを構築し、随時、サブカテゴリや検索Trail提示の仕組みを提案した。これらの支援メカニズムが有用な状況やユーザ特性について検討を深める。さらに、情報源のスタンスなどより包括的な視点の有用性も検討した。(c)コンセプトマップが探索に与える影響について検討した。
    (3) 検索の基礎技術: 今年度は、自然言語対話、モバイル端末におけるタッチインタラクション、検索実験計画法と評価法について研究をすすめた。
  • 日本学術振興会:科学研究費助成事業 基盤研究(C)
    研究期間 : 2016年04月 -2019年03月 
    代表者 : 原口 誠, 大久保 好章, 吉岡 真治
     
    物語や判例などにおいて,各物語に固有な登場人物などの違いを超えて観察できる類似性を検出することが本研究の目的であり,登場人物や物の間に同一もしくは類似した関係が成り立つときに二つの物語は関係構造が類似しているという.本研究では2個以上の複数の物語文を与え,一定数の物語で具体化できる共通の関係構造類似性を,行列非負分解やグラフマイニングの技法を用いて抽出できるアルゴリズムを与えた.この手法はテキスト解析のみならず,複数のデータウェアハウス間の共通関係構造抽出などにも応用でき,一般的なものである.
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2014年04月 -2017年03月 
    代表者 : 宇津呂 武仁, 吉岡 真治, 乾 孝司, 中川 裕志
     
    本研究では,ウェブ検索者の情報要求観点を情報源とする「言語間対照分析支援システム」を作成した.具体的には,各言語の検索エンジン・サジェストおよび質問回答サイトを情報源として,特定のクエリ・フォーカスに対する情報要求観点,および,その観点に関して得られる情報を収集した.そして,収集された情報を言語間で比較・対照分析することにより,他国と自国との間の文化・関心・意見の違いを発見する過程を支援するシステムを作成した.
  • 日本学術振興会:科学研究費助成事業 挑戦的萌芽研究
    研究期間 : 2014年04月 -2016年03月 
    代表者 : 吉岡 真治, 原 真二郎
     
    本研究では、ナノ結晶デバイス開発論文を対象として、主に論文中の実験に関する条件や結果に関わる情報(材料や関係するパラメータなど)を抽出するためのコーパスの作成と、そのコーパスを利用した情報抽出システムNaDevの開発を行った。本システムを用いることにより、論文、アブストラクト、図表のキャプションから、単純なキーワードではない実験に関係するキーワードを抽出することができ、論文の類似性判定、抽出した情報を利用した検索の絞り込み支援システムなどを作成することが可能となる。本研究では、プロトタイプシステムとしての図表検索システムの提案を行った。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2013年04月 -2016年03月 
    代表者 : 吉岡 真治, 神門 典子
     
    本研究では、Wikipedia上のメタデータとして整理したDBPediaの情報を利用した固有名詞とそのタイプ(人名・地名・組織名など)の抽出を行うとともに、そのタイプの情報を考慮した情報検索に有用なインデックスについて検討を行い、固有名詞のタイプを観点(facet)として扱い、複数の観点の存在を考慮したfacet-biasedトピックモデルを提案した。また、Wikipediaの情報の一貫性をDBPediaの情報を用いて分析するためのツールであるWC3を作成し、具体的に、Wikipedia中に存在するメタデータのエラーや、カテゴリ付与の一貫性がかける事例などを指摘できることを確認した。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2011年04月 -2014年03月 
    代表者 : 宇津呂 武仁, 吉岡 真治, 乾 孝司, 中川 裕志, 清田 陽司
     
    本研究では,ウェブ上で収集可能な多言語ニュース・ブログ・電子掲示板等の文書を情報源として,多言語での報道内容,関心動向や,意見の分布を分析し,国・文化・言語の間でどのような違いがあるのかを発見する過程を支援する方式について研究を行った.本研究では,以下の(i)~(iv)の多様な観点における差異に着目し,各観点における差異を発見する過程を支援する方式を実現した.(i) 一つのトピックの中での詳細な話題・関心事項の差異.(ii) 国・文化・言語の間の時系列特性の差異.(iii) 書き手の実体験に関する差異.(iv) 賛否・主観の差異.
  • 日本学術振興会:科学研究費助成事業 基盤研究(A)
    研究期間 : 2010年04月 -2013年03月 
    代表者 : 大山 敬三, 相澤 彰子, 宮尾 祐介, 孫 媛, 小林 哲郎, 韓 浩, 岸田 和明, 山名 早人, 奥村 学, 吉岡 真治, 石田 栄美, 村田 剛志, 江口 浩二
     
    Webの構造や利用者の情報検索・閲覧行動を総合的に理解し,応用として展開するため,Web閲覧ログデータやマイクロブログデータ等,Web情報構造とWeb利用者行動に関連する様々なデータを収集・導入し,アンケート調査とも連動させることにより,これらを統合・分析した。 その結果,知りたい情報と知らせたい情報との間の乖離や,Webポータルサイトを利用することにより意図しない情報接触行動が生ずることなど,Web利用者に関する様々な知見が実証的に得られた。また,統合・分析により得られた情報に基づいて,情報推薦や情報検索等の情報アクセスを高度化するための様々な手法を研究・提案した。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2009年 -2011年 
    代表者 : 吉岡 真治, 神門 典子, 関 洋平
     
    本研究は、日中韓の異なる言語で記述されているニュースサイトの内容を比較対照することにより、ニュース分析を行うシステムを提案した。この中で、多様な観点からのニュースを比較するためのマルチファセット分析と、その分析を支えるための、地名などのデータベースの構築、意見分析システムの構築を行った。さらに、このようなシステムを評価するために、システム利用前後の知識の変化に注目したシステムの分析手法の提案を行った。
  • 日本学術振興会:科学研究費助成事業 特定領域研究
    研究期間 : 2007年 -2008年 
    代表者 : 吉岡 真治, 原口 誠, 大久保 好章
     
    本研究では、情報抽出元である各々のWebサイトが持つ情報の偏りなどの特徴を分析する方法を提案すると共に、この特徴分析の結果を踏まえた意見集約・分析の方法を提案している。具体的には、全てのデータセットを含む全体のデータベースと特定の条件を満たす部分データベースにおけるデータの分布の違いに注目したコントラストセットマイニングを適用することにより、個々のサイトの特徴を分析する方法を提案する。 この目標に対して、本年度は、「コントラストセットマイニングによる個々のサイトの特徴分析」の考え方に基づくシステムを実装し、様々なレベルのユーザ実験を通した評価を行った。簡単にシステムを使用してもらってコメントをもらうというユーザ実験では、半数以上の利用者から、システムが有用であるというコメントをもらえた。一方、レポート作成課題の実施という本システムの利用目的に応じた課題の遂行という実験を行ったところ、異なる国のデータとの比較を行う際には、外国語の新聞を直接の比較対象とする必要性などが指摘された。この指摘を受け、機械翻訳システムと組み合わせることによりシステムを作成した。このシステムでは、ニュースなどの時事的なトピックに対する対訳辞書の不備を補うためのWikipediaを用いた対訳辞書の作成方法などの提案も行った。また、ピンポイントクラスタリングによるWebサイトの分析」の課題については、昨年度から継続して、フォーマルコンセプト(FCA)を用いた分枝限定法にもとづくトップN-FC探索手法の研究を行った。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2007年 -2008年 
    代表者 : 原口 誠, 富田 悦次, 伊藤 公人, 吉岡 真治, 大久保 好章
     
    潜在的なクラスタ間接続を, たとえ, 外延的な重なりが小さな場合でも, 内包的な繋がりが高い場合は有意義なクラスタ間接続関係を与える「情間」と捉える.こうした「情間」は, クラスタの外延と内包に対する評価関数を設定することにより, 制約条件下の最適化問題として捉えることができ, 具体的には, 形式概念束探索における分枝限定アルゴリズムとして設計・開発・実証を行った.形式概念束は, 概念の抽象階層と見なすことができ, 主要なクラスタを繋ぐ適切な概念を抽象階層から見出すことを意味している.実証実験において, カテゴリとしては離れた異種文書群から, それらを跨ぐ, 機能的な概念を情間(クロスオーバ概念)として抽出することに成功している.
  • 日本学術振興会:科学研究費助成事業 若手研究(B)
    研究期間 : 2005年 -2007年 
    代表者 : 吉岡 真治
     
    本研究では、問題解決を目的とした文書作成支援型知識マネージメントシステム(Documentation MAnagementsystem for Problem Solving:DMaPS)の構築を目的とした研究を実施した。このシステムでは、問題解決の支援、文書と形式化された知識の蓄積、文書からの知識の獲得というループの実現を目指している。この目的に対し、平成17年度は、問題解決の支援を行うために、ユーザが持っている問題に関する記述と類似している文書知識を提示することにより、問題解決の支援を行うシステムを作成した。本システムに対し、あらかじめ手作業により作成した知識を埋め込んだ文書群を与えることにより、問題解決の支援が可能であることを確認した。平成18年度以降は、主に、一般的な文書から問題解決に役立つ知識を獲得するための方法論に注目して研究を遂行した。具体的には、トラブル事例に関する知識獲得を目指して、新聞記事などから、ユーザが直面している問題に関連する訴訟の記事などを検索し、その検索結果から、関係する利害関係者とその関係を抽出するシステムの構築を行った。本システムでは、少数の訓練事例にたいして、複数の基準を用いた機械学習システムを適用し、その結果を組み合わせることによって、人手で作成したパターンでは抽出することができなかった多くの利害関係者の情報を獲得することが確認できた。また、文書分類の研究では、特許を関連する物理法則によって分類する考え方を提案し、Web上に存在する様々な物理法則に関する文書の情報などを利用して、具体的な特許文書を分類する方法を提案した。ただ、これらで得た知識は、DMaPSで利用可能なレベルの知識での形式化が困難であったため、今後は、形式的な知識作成に関する検討を進める必要がある。
  • 日本学術振興会:科学研究費助成事業 特定領域研究
    研究期間 : 2004年 -2005年 
    代表者 : 吉岡 真治, 原口 誠, 大久保 好章
     
    本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。 そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化し、新たな検索式を作成する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。 本年度は、検索式における検索語と検索要求のミスマッチという観点から検索課題の持つ性質の分類を行うと共に、検索語拡張に与える影響を分析した。その結果、検索語と検索要求のミスマッチのタイプに応じて、検索語拡張に求められる機能も異なり、単一の検索語拡張手法では、検索性能を改善させる場合だけでなく、性能を悪化させる場合があることが確認された。よって、検索語拡張の洗練化を行うためには、検索語と検索要求のミスマッチに応じた検索語拡張の方法の提案と、ミスマッチのタイプの推定を行うことが必須であることを提案した。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2004年 -2005年 
    代表者 : 原口 誠, 田中 譲, 角田 篤泰, 吉岡 真治, 大久保 好章
     
    本研究の最終目標は、文化的背景ないし目的を共有する人々が、類似していると考える文書群に共通なストーリー構造を抽出し、抽出された構造をスクリプト的に用いることにより、より直感的で人々の共感を得やすい文書を生成するための基盤技法を確立することにある。主な具体的な成果は以下の通りである。 イベント列としての物語を、主題を中心にして分割するために、テキストセグメンテーションにより、連続したイベントからなる複数のイベントブロックに分割する。ブロック毎に話題を表す語彙(中心語彙群)を共起性に基づくグラフにおけるクリークとして抽出し、話題は共起に関して密に結合された語彙集合として定める。次に、話題を結びつける機能を持つ語彙もしくはイベントを特定する。昨年度実装した方式は手がかかり語によってアドホックに決める方式であったが、本年度は、キーグラフ同様に、異なる中心語彙群との相関により話題に基づく支持度を求め、複数の話題に共通に支持される度合いを語彙が持っ話題結合度として定めた。話題結合度の高い語彙は、文脈的な語彙として捉えることが可能であり、そうした結合度の高い語彙をより多く含むイベントを複数のブロックを繋ぐイベントとして抽出する。 上記の手法で同定された物語構造(イベントブロック-中心語彙群-ブロック結合構造)を保存する構造写像を高速に算出するためのアルゴリズムを、イベントブロックの分割統治と過度の抽象化を抑制する制御規則を持つものとして策定した。高速化のポイントは、分割統治の効果と過度の抽象化の制御規則が固有に持つ枝刈規則に加え、中心語彙群と結合構造の保存性スコアーを新たに導入し、そのスコアー下限値(事前に与える)に基づく枝刈規則を新たに与える点にある。これら3種類の探索枝刈の実装により、一般には指数オーダの処理が必要になる構造類比の算出手法の高速化に対する新たな道を切り開いた。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2002年 -2004年 
    代表者 : 武田 英明, 下村 芳樹, 吉岡 真治, 冨山 哲男
     
    本研究で提案するUniversal Abduction Studioとは、設計者の創造的な思考を支援するために、目的思考の知識操作を可能にする環境である。ここで知識操作とは、様々な領域知識を新しい設計目的の元に関係性を発見し、再構成する操作である。本研究では、設計問題で見られるような実世界の問題を解決するような創造的アブダクションのモデル化を行う。 まず、どのような設計知識が利用されているかを調べるため、設計に関する本から知識抽出を試みた。この抽出された知識を分析することで、設計知識は多様な解釈が可能である必要性、オントロジーの必要性などがわかった。 次に設計知識をどのように計算机上で表現するかについて議論を行い、Semantic Webにおける方法論を参考に、独自の知識表現を提案した。設計知識を構成する要素として、述語オントロジー、対象オントロジー、属性オントロジーを用意し、設計知識そのものはRDFのグラフ構造として表現する方法を提案した。この提案に基づいて、設計知識のエディタ、この知識を用いた類似推論のシステムを構築した。
  • 日本学術振興会:科学研究費助成事業 特定領域研究
    研究期間 : 2003年 -2003年 
    代表者 : 吉岡 真治, 大久保 好章, 原口 誠
     
    本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。 そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化し、新たな検索式を作成する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。 本年度は、この適合的汎化による検索拡張が、正解文書において補完関係にある検索語の発見を目指しているという点に注目し、適合的汎化による検索拡張の結果をBoolean式として表現する方法について検討を行った。さらに、実際にユーザが利用可能なインターフェースの作成を行った。また、文書中の語の役割を反映した抽象概念の提案手法についても検討を行った。これらの手法の有効性は、実際のユーザ実験によって検討する必要性がある。次年度以降は、ユーザ実験などを通して、本手法の有効性の検証と手法の洗練化を図っていきたいと考えている。
  • 日本学術振興会:科学研究費助成事業 特定領域研究
    研究期間 : 2002年 -2002年 
    代表者 : 吉岡 真治, 大久保 好章, 原口 誠
     
    本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案している。この概念階層を利用する情報検索システムでは、汎化の対象としてどの様な語を選ぶのかという問題に加え、あらかじめ用意する辞書における概念階層の性質に結果が依存するという問題がある。 本年度は、汎化のための方法論として、適合文書群に共通する概念を利用する方法を検討した。学術論文のアブストラクトを用いたNTCIRや新聞記事を用いたIREXの2つの情報検索のテストコレクションを利用し提案手法のシステムの検索性能への影響を検討した。その結果、提案手法により検索性能が向上することが確認できた。 次に、辞書の性質を議論するために、昨年度までの研究で用いていたEDR電子化辞書に加え、日本語概念語彙体系という異なるタイプのシソーラスを用いた場合の影響に関する分析を行った。検索実験の結果、日本語概念語彙体系を用いた場合に、与えた適合文書へのオーバーフィットの度合いが高いことが確認された。これは、日本語概念語彙体系とEDRが持つ概念カテゴリーの粒度の違いによるものであると考えられる。日本語概念語彙体系とEDRが持つ概念カテゴリーの数を単純に比較すると、EDRは約50000個(専門用語辞書のものを含む)であり、日本語概念語彙体系は約3000である。よって、適合的汎化による情報検索システムで用いるシソーラスは、ある程度、粒度の細かい概念を扱うことができるシソーラスであることが望まれることが確認された。
  • 日本学術振興会:科学研究費助成事業 若手研究(B)
    研究期間 : 2001年 -2002年 
    代表者 : 吉岡 真治
     
    本研究では、設計問題に代表される問題解決の過程を問題を表現するためのモデルとそこで用いられた知識さらに、その際に記述された文書を組み合わせて保存することにより、設計文書の体系的管理と再利用を実現することを目的とした。その成果として、問題解決のための文書管理システムDMaPS(Documentation Management system for Problem Solving)を提案した。 このDMaPSでは、ひとつのサブ問題の問題解決の過程を単位として考えた文書知識を利用して、文書の管理と問題解決の支援を行う。この文書知識では、文書を単純なテキスト情報として保存するだけではなく、知識を適用する背景となる条件や形式的な知識を一階述語論理によって表現する、この二つの表現を組み合わせることにより、マニュアルなどの形式知とノウハウのように形式化が困難な情報を組み合わせて取り扱うことが可能となる。 本システムでは、この文書知識を用いることにより、ユーザの問題解決の支援を行う。具体的には、ユーザが直面している問題との一階述語論理による形式的表現に関する類似性とキーワードによる情報検索による類似性という異なる観点から知識の検索を行うことができ、より柔軟な知識の検索を実現する。また、検索された知識を取り込むことにより、問題解決の過程を説明するための文書が半自動的に作成でき、ユーザは個別事例に適応させる部分の記述に専念することができる。さらに、本システムでは、知識のバージョン管理の機構を取り込んでおり、各文書問題解決の際に利用した知識のバージョンをチェックすることにより、既存の設計文書をそのまま再利用してよいのか、再検討が必要なのかを調べることが可能になっている。 本研究では、建築構造物の基礎設計を例にとり、知識記述の実験を行い、体系的な知識整理が可能であることを示した。
  • 日本学術振興会:科学研究費助成事業 特定領域研究(C)
    研究期間 : 2001年 -2001年 
    代表者 : 吉岡 真治, 大久保 好章, 原口 誠
     
    本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。 しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。 そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。 一方、電子化辞書やシソーラスでは、一般的な概念階層が記述されているために、多段階の階層を用いた汎化を行った際に、一度に大量の語を代表する概念に汎化されてしまう問題がある。例えば、「ビデオ」と「DVD」を汎化した概念として「映像装置」という概念を考えたときに、8mmカメラは含むことは、検索意図と必ずしも一致しないと考えられる。そのため、ユーザが持つ細かな検索意図を適切に表現するために、検索目的に応じた適切な抽象概念を設定し、概念階層を再構築することが必要である。 本年度は、概念の適切な抽象化のための指標として、キーワードと正解文書の相互情報量に基づく関連性の指標を利用し、情報検索システムを構築した。本システムは、5件の正解文書を与えることにより、検索語の汎化を行い、検索者の意図が理解しやすい検索式が作成可能である。また、この検索式による検索は、他の検索システムと比較して十分な検索精度を持っていることを確認した。
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 1999年 -2001年 
    代表者 : 武田 英明, 竹内 孔一, 上野 敦志, 西田 豊明, 吉岡 真治, 市瀬 龍太郎, 岩爪 道昭, 久米 出
     
    本研究ではネットワークにおけるコミュニケーション支援のための知識ライフサイクルを実現するために「メディアとしての知識」という概念を提起した.ここでは知識は個別の人や計算機(エージェント)の内部にあるのではなく,コミュニケーションを可能としているものが知識であるという概念である.このように考えるとき知識は閉じたものではなく開いたものになり,個々の人や計算機の内部でなくそれらの中間にあることになる.メディアとしての知識を再定義することで,本研究の各研究は体系的に位置付けられる.すなわち,オントロジーはエージェント間で共通性の高い知識であり,コミュニティの知識,環境の知識は中間であり,身体性に基づく知識は個別性の高い知識である.また人と計算機・機械という軸で考えると,オントロジーと身体性に基づく知識は共通性を目指すの対して,コミュニティの知識,環境の知識は人や機械の特質を取り込む知識であるといえる. 具体的には3つの成果がある.まず,コミュニティシステムにおいてはインタフェースエージェントを用いたコミュニティ活動支援システムTelMeAの被験者実験を行い,評価を行った.この評価においては本システムはこれまでのテキストだけのシステムに比べてマルチモーダルな会話が行えることが確認できた.また主観評価ではすべての面でテキストによるシステムの評価を上回り,ユーザに受け入れやすいシステムであることが確認でした. 個人的知識を獲得するシステムにおいても被験者実験を行い,十分な効果があることが確認できた.このシステムにおいてシステムが提案してくる過去のメモ(リンク)はユーザに受け入れやすいものであったこと,またこのメモに基づく要約においてもよい性能があることがわかった. 身体性に基づく知識としてロボットが自律的に自らの身体に基づく行動がとることが可能な学習方法を提案した.これよって身体形状を事前に与えられなくても行動を通じて身体に関する知識を獲得することが可能になった.
  • 日本学術振興会:科学研究費助成事業 国際学術研究
    研究期間 : 1995年 -1997年 
    代表者 : 猪瀬 博, 酒井 善則, 瀬崎 薫, 飯田 記子, 安田 靖彦, 藤野 貴之, 吉岡 真治, 趙 偉平, 阿部 俊二, 魚瀬 尚郎, LANDWEBER L, 相澤 彰子, 計 宇生, 大山 敬三, 松方 純, 橋爪 宏達, 安達 淳, 宮澤 彰, 浅野 正一郎, 浜田 喬, 小野 欽司, LANDWEBER La, 山田 尚勇
     
    近年の学術研究の国際化に伴い、国際的な連携が図られた研究ネットワークの運用が求められている。ことに、アジア、大洋州、北米、欧州に加えて、東欧・ロシア、南米、アフリカの地域に研究ネットワークが拡大したことによる国際調整の在り方を検討することは緊急の課題であり、また研究ネットワークの超高速化に伴う技術課題の調整も重要となる。 今年度は、国際的な学術研究ネットワークの調整を行っている国際研究ネットワーク調整会議で主要な論議がなされている研究ネットワークの国際的相互接続の検討に参加し、同時に検討を主導することにより、次世代の国際研究ネットワークの形成に寄与した。更に成果を反映して、米国シカゴに設置された高速研究ネットワークの国際交換点(STAR-TAP)を経由して、学術情報センターが運用するSINETを接続し、超高速通信の環境を日本の研究者に提供している。 欧州では、TEN-34と称する超高速研究ネットワークの運用が開始される一方、各国の協力により次世代ネットワークの開発計画(JAMES)が進行している。従来の経緯を踏まえて、学術情報センターは英国ロンドンを起点としてTEN-34との接続のための調整を続け、接続を実現するに至っている。また同時に、JAMESの調査を実施している。並行して、OECDでは情報社会の実現に向けて政索の強調が続けられているが、これに副議長として参加し、議論を主導した。 国際的なネットワーク技術の標準化組織であるIETFには、今年は新たに超高速ネットワークの運用に関する基本技術を2件提案している。このために、IETFには継続的に参加し、国際貢献を果たしている。 以上のように、今年度は当初の計画を大幅に上回る成果を得ている。以上をもって、3ヶ年にわたる本調査を終了する。
  • 大規模知識ベースを用いた設計支援の研究
    研究期間 : 1996年

教育活動情報

主要な担当授業

  • コンピュータサイエンス演習Ⅱ
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
  • 大学院共通授業科目(一般科目):自然科学・応用科学
    開講年度 : 2018年
    課程区分 : 修士課程
    開講学部 : 大学院共通科目
  • 知識ベース特論
    開講年度 : 2018年
    課程区分 : 修士課程
    開講学部 : 情報科学研究科
    キーワード : 知識ベース, データベース, 知識発見, クラスタリング, セマンティックWeb, オントロジー, 情報検索, 情報抽出
  • 知識ベース特論
    開講年度 : 2018年
    課程区分 : 博士後期課程
    開講学部 : 情報科学研究科
    キーワード : 知識ベース, データベース, 知識発見, クラスタリング, セマンティックWeb, オントロジー, 情報検索, 情報抽出
  • 複合情報工学
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : ハードウェア構成、機械語命令、ノイマン型計算機、並列計算機、スーパーコンピュータ、ファームウェア、マイクロプロセッサ、パイプライン処理、キャッシュメモリ、プロセス、スレッド、スケジューリング、割り込み、デッドロック、メモリ管理、仮想メモリ、ページング、ファイルシステム
  • 情報理工学実験Ⅱ
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : データベース、Web、機械学習、並列プログラミング
  • コンピュータサイエンス実験Ⅱ
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : データベース、Web、機械学習、並列プログラミング
  • エージェント工学
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : 関係データベース、データベースシステム、情報検索、Web情報処理、テキストマイニング
  • データベースとWebインテリジェンス
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : 関係データベース、データベースシステム、情報検索、Web情報処理、テキストマイニング
  • データベースと情報検索
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : 関係データベース、データベースシステム、情報検索、Web情報処理、テキストマイニング
  • 応用数学Ⅲ
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : 複素変数、複素函数、複素積分、ローラン展開、留数解析
  • コンピュータシステム
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : ハードウェア構成、機械語命令、ノイマン型計算機、並列計算機、スーパーコンピュータ、ファームウェア、マイクロプロセッサ、パイプライン処理、キャッシュメモリ、プロセス、スレッド、スケジューリング、割り込み、デッドロック、メモリ管理、仮想メモリ、ページング、ファイルシステム
  • 情報理工学演習Ⅰ
    開講年度 : 2018年
    課程区分 : 学士課程
    開講学部 : 工学部
    キーワード : コンピュータシステム、ネットワークとクラウド、計算機アーキテクチャ、オペレーティングシステム、コンピュータネットワーク、Web技術、クラウド技術

大学運営

委員歴

  • 2018年06月 - 現在   人工知能学会   理事
  • 2013年04月 - 2015年03月   情報処理学会   情報基礎とアクセス技術研究会 幹事
  • 2011年 - 2013年   情報処理学会 情報基礎とアクセス技術研究会 運営委員
  • 2009年 - 2011年   情報処理学会   情報学基礎研究会 運営委員   情報処理学会
  • 2009年 - 2011年   情報処理学会   研究会論文誌TOD編集委員   情報処理学会
  • 2009年   日本機械学会   設計工学システム部門 代議員   日本機械学会
  • 2007年 - 2008年   情報処理学会   情報学基礎研究会 幹事   情報処理学会
  • 2007年 - 2008年   情報処理学会   研究会論文誌TOD共同編集委員長   情報処理学会
  • 2006年 - 2007年   日本機械学会   設計工学システム部門 広報委員会幹事   日本機械学会
  • 2006年 - 2007年   人工知能学会   編集委員   人工知能学会
  • 2005年 - 2006年   情報処理学会   情報学基礎研究会 主査   情報処理学会
  • 2003年 - 2006年   情報処理学会   研究会論文誌TOD編集委員   情報処理学会
  • 2004年 - 2005年   人工知能学会   人工知能基本問題研究会 幹事   人工知能学会
  • 2001年 - 2005年   人工知能学会   編集委員   人工知能学会
  • 2004年   情報処理学会   情報学基礎研究会 幹事   情報処理学会
  • 2003年   情報処理学会   情報学基礎研究会 運営委員   情報処理学会


Copyright © MEDIA FUSION Co.,Ltd. All rights reserved.