吉岡 真治 (ヨシオカ マサハル)
情報科学研究院 情報理工学部門 知識ソフトウェア科学分野 | 教授 |
■研究者基本情報
Researchmap個人ページ
ホームページURL
J-Global ID
研究キーワード
■経歴
経歴
- 2019年04月 - 現在
北海道大学, 大学院情報科学研究院情報理工学部門, 教授 - 2018年01月 - 2019年03月
北海道大学, 大学院情報科学研究科 情報理工学専攻, 教授 - 2014年04月 - 2017年12月
北海道大学, 大学院情報科学研究科, 准教授 - 2008年04月 - 2014年03月
北海道大学, 大学院情報科学研究科 コンピュータサイエンス専攻, 准教授 - 2004年04月 - 2008年03月
北海道大学, 大学院情報科学研究科 コンピュータサイエンス専攻, 助教授 - 2001年06月 - 2004年03月
北海道大学, 大学院工学研究科, 助教授 - 2000年04月 - 2001年05月
国立情報学研究所 情報学資源研究センター, 助手 - 1996年04月 - 2000年03月
学術情報センター, 助手
委員歴
- 2024年01月 - 現在
ACM SIGIR, Steering committee member of International Conference on the Theory of Information Retrieval (ICTIR), 学協会 - 2017年12月 - 2021年06月
Tokyo ACM SIGIR Chapter, Treasurer, 学協会 - 2018年06月 - 2020年06月
人工知能学会, 理事, 学協会 - 2009年 - 2019年
Steering committee member of Asian Information Retrieval Societies, 学協会 - 2013年04月 - 2015年03月
情報処理学会, 情報基礎とアクセス技術研究会 幹事, 学協会 - 2011年 - 2013年
情報処理学会 情報基礎とアクセス技術研究会 運営委員, 学協会 - 2009年 - 2011年
情報処理学会, 情報学基礎研究会 運営委員, 学協会 - 2009年 - 2011年
情報処理学会, 研究会論文誌TOD編集委員, 学協会 - 2009年
日本機械学会, 設計工学システム部門 代議員, 学協会 - 2007年 - 2008年
情報処理学会, 情報学基礎研究会 幹事, 学協会 - 2007年 - 2008年
情報処理学会, 研究会論文誌TOD共同編集委員長, 学協会 - 2006年 - 2007年
日本機械学会, 設計工学システム部門 広報委員会幹事, 学協会 - 2006年 - 2007年
人工知能学会, 編集委員, 学協会 - 2005年 - 2006年
情報処理学会, 情報学基礎研究会 主査, 学協会 - 2003年 - 2006年
情報処理学会, 研究会論文誌TOD編集委員, 学協会 - 2004年 - 2005年
人工知能学会, 人工知能基本問題研究会 幹事, 学協会 - 2001年 - 2005年
人工知能学会, 編集委員, 学協会 - 2004年
情報処理学会, 情報学基礎研究会 幹事, 学協会 - 2003年
情報処理学会, 情報学基礎研究会 運営委員, 学協会
■研究活動情報
受賞
- 2022年02月, Linked Open Data チャレンジ 2021 実行委員会, オントロジー賞(オントロノミー合同会社)
Wikipediaカテゴリオントロジー
北海道大学大学院情報科学研究院知識ベース研究室 - 2022年02月, Linked Open Data チャレンジ 2021 実行委員会, データ作成部門 優秀賞
Wikipediaカテゴリオントロジー
北海道大学大学院情報科学研究院知識ベース研究室 - 2015年06月, 人工知能学会, 人工知能学会 研究会優秀賞
複数国の新聞からの多観点比較による分析~GDELTデータを用いた分析~
吉岡真治;神門典子, 国内学会・会議・シンポジウム等の賞
論文
- Preliminary Experiments of Qualitative Reasoning Model Construction Using Large Language Model
Shinpei Suzuki, Masaharu Yoshioka
Proceedings of the QR 2024 - 37th International Workshop on Qualitative Reasoning, 58, 63, 2024年10月, [査読有り], [最終著者]
英語, 研究論文(国際会議プロシーディングス) - Overview of Benchmark Datasets and Methods for the Legal Information Extraction/Entailment Competition (COLIEE) 2024.
Randy Goebel, Yoshinobu Kano, Mi-Young Kim, Juliano Rabelo, Ken Satoh, Masaharu Yoshioka
JSAI-isAI, 109, 124, 2024年05月, [査読有り]
研究論文(国際会議プロシーディングス) - Overview and Discussion of the Competition on Legal Information, Extraction/Entailment (COLIEE) 2023.
Randy Goebel, Yoshinobu Kano, Mi-Young Kim, Juliano Rabelo, Ken Satoh, Masaharu Yoshioka
Rev. Socionetwork Strateg., 18, 1, 27, 47, 2024年04月, [査読有り]
研究論文(学術雑誌) - Coding Open-Ended Responses using Pseudo Response Generation by Large Language Models.
Yuki Zenimoto, Ryo Hasegawa, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando
NAACL (Student Research Workshop), 242, 254, 2024年
研究論文(国際会議プロシーディングス) - OSPAR: A Corpus for Extraction of Organic Synthesis Procedures with Argument Roles.
Kojiro Machi, Seiji Akiyama, Yuuya Nagata, Masaharu Yoshioka
Journal of chemical information and modeling, 63, 21, 6619, 6628, 2023年10月19日, [査読有り], [最終著者, 責任著者], [国際誌]
英語, 研究論文(学術雑誌), There is a pressing need for the automated extraction of chemical reaction information because of the rapid growth of scientific documents. The previously reported works in the literature for the procedure extraction either (a) did not consider the semantic relations between the action and argument or (b) defined a detailed schema for the extraction. The former method was insufficient for reproducing the reaction, while the latter methods were too specific to their own schema and did not consider the general semantic relation between the verb and argument. In addition, they did not provide an annotated text that aligned with the structured procedure. Along these lines, in this work, we propose a corpus named organic synthesis procedures with argument roles (OSPAR) that is annotated with rolesets to consider the semantic relation between the verb and argument. We also provide rolesets for chemical reactions, especially for organic synthesis, which represent the argument roles of actions in the corpus. More specifically, we annotated 112 organic synthesis procedures in journal articles from Organic Syntheses and defined 19 new rolesets in addition to 29 rolesets from an existing language resource (Proposition Bank). After that, we constructed a simple deep learning system trained on OSPAR and discussed the usefulness of the corpus by comparing it with chemical description language (XDL) generated by a natural language processing tool, namely, SynthReader. While our system's output required more detailed parsing, it covered comparable information against XDL. Moreover, we confirmed that the validation of the output action sequence was easy as it was aligned with the original text. - COLIEE 2022 Summary: Methods for Legal Document Retrieval and Entailment
Mi-Young Kim, Juliano Rabelo, Randy Goebel, Masaharu Yoshioka, Yoshinobu Kano, Ken Satoh
New Frontiers in Artificial Intelligence, 51, 67, Springer Nature Switzerland, 2023年04月06日, [査読有り]
論文集(書籍)内論文 - Summary of the Competition on Legal Information, Extraction/Entailment (COLIEE) 2023.
Randy Goebel, Yoshinobu Kano, Mi-Young Kim, Juliano Rabelo 0001, Ken Satoh, Masaharu Yoshioka
ICAIL, 472, 480, 2023年, [査読有り]
研究論文(国際会議プロシーディングス) - Data-Augmentation Method for BERT-based Legal Textual Entailment Systems in COLIEE Statute Law Task
Yasuhiro Aoki, Masaharu Yoshioka, Youta Suzuki
REVIEW OF SOCIONETWORK STRATEGIES, 16, 175, 196, SPRINGER JAPAN KK, 2022年02月, [査読有り], [責任著者]
英語, 研究論文(学術雑誌), A legal textual entailment task is a task to recognize entailment between a law article and its statements. In the Competition on Legal Information Extraction/Entailment (COLIEE), this task is designed as a task to confirm the entailment of a yes/no answer from the given civil code article(s). Based on the development of deep-learning-based natural language processing tools such as bidirectional encoder representations from transformers (BERT), many participants in the task used such tools, and the best performance system of COLIEE 2020 was a BERT-based system. However, because of the limitation of the size of training data provided by the task organizer, training such tools to adapt to the variability of the questions is difficult. In this paper, we propose a data-augmentation method to make training data using civil code articles for understanding the syntactic structure of the questions and articles for entailment. Our BERT-based ensemble system, which uses this augmentation method, achieves the best performance (accuracy = 0.7037) in Task 4 of COLIEE 2021. We also introduce the results of additional experiments to discuss the characteristics of the proposed method. - Overview and Discussion of the Competition on Legal Information Extraction/Entailment (COLIEE) 2021
Juliano Rabelo, Randy Goebel, Mi-Young Kim, Yoshinobu Kano, Masaharu Yoshioka, Ken Satoh
REVIEW OF SOCIONETWORK STRATEGIES, 18, 1, 27, 47, SPRINGER JAPAN KK, 2022年02月, [査読有り]
英語, 研究論文(学術雑誌), We summarize the 8th Competition on Legal Information Extraction and Entailment. In this edition, the competition included five tasks on case law and statute law. The case law component includes an information retrieval Task (Task 1), and the confirmation of an entailment relation between an existing case and an unseen case (Task 2). The statute law component includes an information retrieval Task (Task 3), an entailment/question answering task based on retrieved civil code statutes (Task 4) and an entailment/question answering task without retrieved civil code statutes (Task 5). Participation was open to any group based on any approach. Eight different teams participated in the case law competition tasks, most of them in more than one task. We received results from six teams for Task 1 (16 runs) and 6 teams for Task 2 (17 runs). On the statute law task, there were eight different teams participating, most in more than one task. Six teams submitted a total of 18 runs for Task 3, 6 teams submitted a total of 18 runs for Task 4, and 4 teams submitted a total of 12 runs for Task 5. Here we summarize the approaches, our official evaluation, and analysis on our data and submission results. - HUKB at the COLIEE 2022 Statute Law Task.
Masaharu Yoshioka, Youta Suzuki, Yasuhiro Aoki
New Frontiers in Artificial Intelligence - JSAI-isAI 2022 Workshop, JURISIN 2022, and JSAI 2022 International Session, 109, 124, Springer, 2022年, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス) - HUKB at ChEMU 2022 Task 1: Expression-Level Information Extraction.
Kojiro Machi, Masaharu Yoshioka
CLEF (Working Notes), 797, 807, CEUR-WS.org, 2022年
研究論文(国際会議プロシーディングス) - Interactive Visualization of the Polarity-based Stance of News Websites using News Genres
Masaharu Yoshioka, Norihiko Tatsunami, Masahiko Itoh, Noriko Kando, James Allan
Proceedings of the 9th International Workshop on News Recommendation and Analytics (INRA 2021), 2021年09月, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス) - Proposal of the Aesthetic Experience-Oriented Evaluation Framework for Field-recording Sound Retrieval System: Experiments using Acoustic Feature Signatures Based on Multiscale Fractal Dimension.
Motohiro Sunouchi, Masaharu Yoshioka
IVSP 2021: 3rd International Conference on Image, Video and Signal Processing(IVSP), 65, 72, ACM, 2021年03月, [査読有り], [最終著者]
英語, 研究論文(国際会議プロシーディングス) - COLIEE 2020: Methods for Legal Document Retrieval and Entailment
Juliano Rabelo, Mi Young Kim, Randy Goebel, Masaharu Yoshioka, Yoshinobu Kano, Ken Satoh
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12758 LNAI, 196, 210, 2021年, [査読有り], [国際共著]
英語, 研究論文(国際会議プロシーディングス), We present a summary of the 7th Competition on Legal Information Extraction and Entailment. The competition consists of four tasks on case law and statute law. The case law component includes an information retrieval task (Task 1), and the confirmation of an entailment relation between an existing case and an unseen case (Task 2). The statute law component includes an information retrieval task (Task 3) and an entailment/question answering task (Task 4). Participation was open to any group based on any approach. Ten different teams participated in the case law competition tasks, most of them in more than one task. We received results from 9 teams for Task 1 (22 runs) and 8 teams for Task 2 (22 runs). On the statute law task, there were 14 different teams participating, most in more than one task. Eleven teams submitted a total of 28 runs for Task 3, and 13 teams submitted a total of 30 runs for Task 4. We summarize the approaches, our official evaluation, and analysis on our data and submission results. - Diversity-robust acoustic feature signatures based on multiscale fractal dimension for similarity search of environmental sounds
Motohiro SUNOUCHI, Masaharu YOSHIOKA
IEICE Transactions on Information and Systems, E104D, 10, 1734, 1748, 2021年, [査読有り], [最終著者]
研究論文(学術雑誌), This paper proposes new acoustic feature signatures based on the multiscale fractal dimension (MFD), which are robust against the diversity of environmental sounds, for the content-based similarity search. The diversity of sound sources and acoustic compositions is a typical feature of environmental sounds. Several acoustic features have been proposed for environmental sounds. Among them is the widely-used Mel-Frequency Cepstral Coefficients (MFCCs), which describes frequency-domain features. However, in addition to these features in the frequency domain, environmental sounds have other important features in the time domain with various time scales. In our previous paper, we proposed enhanced multiscale fractal dimension signature (EMFD) for environmental sounds. This paper extends EMFD by using the kernel density estimation method, which results in better performance of the similarity search tasks. Furthermore, it newly proposes another acoustic feature signature based on MFD, namely very-long-range multiscale fractal dimension signature (MFD-VL). The MFD-VL signature describes several features of the time-varying envelope for long periods of time. The MFD-VL signature has stability and robustness against background noise and small fluctuations in the parameters of sound sources, which are produced in field recordings. We discuss the effectiveness of these signatures in the similarity sound search by comparing with acoustic features proposed in the DCASE 2018 challenges. Due to the unique descriptiveness of our proposed signatures, we confirmed the signatures are effective when they are used with other acoustic features. - BERT-based ensemble methods with data augmentation for legal textual entailment in COLIEE statute law task.
Masaharu Yoshioka, Yasuhiro Aoki, Youta Suzuki
Proceedings of the 18th International Conference on Artificial Intelligence and Law, ICAIL 2021, 278, 284, ACM, 2021年, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス), The Competition on Legal Information Extraction/Entailment (COLIEE) statute law legal textual entailment task (task 4) is a task to make a system judge whether a given question statement is true or not by provided articles. In the last COLIEE 2020, the best performance system used bidirectional encoder representations from transformers (BERT), a deep-learning-based natural language processing tool for handling word semantics by considering their context. However, there are problems related to the small amount of training data and the variability of the questions. In this paper, we propose a BERT-based ensemble method with data augmentation to solve this problem. For the data augmentation, we propose a systematic method to make training data for understanding the syntactic structure of the questions and articles for entailment. In addition, due to the nature of the non-deterministic characteristics of BERT fine-tuning and the variability of the questions, we propose a method to construct multiple BERT fine-tuning models and select an appropriate set of models for ensemble. The accuracy of our proposed method for task 4 was 0.7037, which was the best performance among all submissions. - HUKB at ChEMU 2021 Task 2: Anaphora Resolution.
Kojiro Machi, Masaharu Yoshioka
CEUR Workshop Proceedings, 2936, 720, 731, CEUR-WS.org, 2021年, [最終著者]
英語, 研究論文(国際会議プロシーディングス), This paper describes our system for the ChEMU 2021 task 2 of anaphora resolution for extracting chemical reactions from patents. We divide the task into two subtasks: (1) span detection of mentions that include antecedent and anaphor; and (2) mention classification and relation detection. For the first task, we use a deep learning-based approach. For the second task, we use a rule-based approach that uses features related to chemical reactions by ChemicalTagger, which is a state-of-the-art text-mining tool for chemistry. Our system obtained an exact-match F-score of 0.6907 and a relaxed match F-score of 0.7459. - Temporal Information Access
Masaharu Yoshioka, Hideo Joho
Information Retrieval Series, 43, 127, 141, 2021年, [招待有り], [筆頭著者]
英語, 論文集(書籍)内論文, This chapter introduces the research background and details of temporal information access tasks in the NTCIR. The GeoTime task was the first attempt to evaluate temporal information retrieval as an extension of an information-retrieval-for-question-answering task. Temporalia was a task to investigate the role of temporal factors in a search. - Wikipedia Category Ontology: A Framework for Utilization of the Wikipedia Category Structure by Knowledge Engineers.
Masaharu Yoshioka, Takanori Nakagawa
CEUR Workshop Proceedings, 2721, 300, 305, CEUR-WS.org, 2020年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), Wikipedia categories are intended to group together pages on similar topics and are organized in a hierarchical structure. Since the editorial policy for Wikipedia categories differs from policies used by knowledge engineers, various types of relationship exist in its category structure. In this paper, we propose a novel framework called "Wikipedia category ontology" (WCO) that aims to act as a basis for interpreting the Wikipedia category structure and is based on a classification of category and relationship types. WCO enables particular Wikipedia category substructures to be extracted, including class-subclass hierarchies, class-instance, and sets of diffused categories for a particular category. WCO is available online in the form of linked open data at http://wcontology.org/. - COLIEE: 法律文書の情報抽出および含意関係認識を行う国際コンペティション
狩野 芳伸, 吉岡 真治, ラベロ ジュリアーノ, キム ミユン, ゴーベル ランディ, 佐藤 健
人工知能, 35, 3, 377, 384, 一般社団法人 人工知能学会, 2020年, [招待有り], [国際共著], [国内誌]
日本語 - A Summary of the COLIEE 2019 Competition.
Juliano Rabelo, Mi-Young Kim, Randy Goebel, Masaharu Yoshioka, Yoshinobu Kano, Ken Satoh
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 12331 LNAI, 34, 49, Springer, 2019年, [査読有り], [国際共著]
研究論文(国際会議プロシーディングス), We summarize the evaluation of the 6th Competition on Legal Information Extraction/Entailment (COLIEE 2019). The competition consists of four tasks: two on case law and two on statute law. The case law component includes an information retrieval task (Task 1), and the confirmation of an entailment relation between an existing case and an unseen case (Task 2). The statute law component also includes an information retrieval task (Task 3) and an entailment/question answering task (Task 4), which attempts to confirm whether a particular statute applies to a yes/no question. Participation was open to any group in the world, based on any approach. Eleven different teams participated in the case law competition tasks, some of them in more than one task. We received results from 7 teams for Task 1 (15 runs) and 7 teams for Task 2 (18 runs). For the statute law tasks, 8 different teams participated, some in more than one task. Seven teams submitted a total of 13 runs for Task 3, and 7 teams submitted a total of 15 runs for Task 4. Here we summarize each team’s approaches, our official evaluation, and some analysis of the variety of methods that produced the evaluation results. - Construction of In-House Papers/Figures Database System using PDFs
M. Yoshioka, S. Hara
Collected Abstract of the 12th International Workshop on Information Search, Integration, and Personalization (ISIP 2018), Fukuoka, Japan, May 14-15, 2018., 1, 1, 2018年05月, [査読有り]
英語 - COLIEE-2018: Evaluation of the Competition on Legal Information Extraction and Entailment.
Yoshinobu Kano, Mi-Young Kim, Masaharu Yoshioka, Yao Lu, Juliano Rabelo, Naoki Kiyota, Randy Goebel, Ken Satoh
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 11717 LNAI, 177, 192, Springer, 2018年, [査読有り], [国際共著]
研究論文(国際会議プロシーディングス), We summarize the evaluation of the 5th Competition on Legal Information Extraction/Entailment 2018 (COLIEE-2018). The COLIEE-2018 tasks include two tasks in each of statute law and case law. The case law component includes an information retrieval (Task 1), and the confirmation of an entailment relation between an existing case and an unseen case (Task 2). The statute law component includes information retrieval (Task 3) and entailment/question answering (Task 4). Participation was open to any group based on any approach. 13 teams participated in the case law competition, and we received results from 7 teams where 6 submissions to Task 1 (12 runs), and 4 submissions to Task 2 (8 runs). Regarding the statute law, there were submissions of 17 runs from 8 teams (including 2 organizers’ runs) for Task 3 and 7 runs from 3 teams for Task 4. We describe each team’s approaches, our official evaluation, and analysis on our data and submission results. We also discuss possibilities for future competition tasks. - Construction of an In-House Paper/Figure Database System Using Portable Document Format Files.
Masaharu Yoshioka, Shinjiro Hara
Information Search, Integration, and Personalization (Communications in Computer and Information Science (CCIS), edited by D. Kotzinos, D. Laurent, N. Spyratos, Y. Tanaka, and R. Taniguchi, Springer International Publishing, Switzerland, 2019), Vol. 1040, 41, 52, Springer, 2018年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), Several general-purpose databases of research papers are available, including ScienceDirect and Google Scholar. However, these systems may not include recent papers from workshops or conferences for special interest groups. Moreover, it can be helpful for researchers in a particular domain to analyze research papers using their own terminology. To support these researchers, we propose a new database system based on the information extracted from portable document format documents that enables annotation of terms via a terminology extraction system. In this paper, we evaluate our system using a use-case experiment and discuss the appropriateness of the system. - Visualizing Polarity-based Stances of News Websites.
Masaharu Yoshioka, Myungha Jang, James Allan, Noriko Kando
Proceedings of the Second International Workshop on Recent Trends in News Information Retrieval co-located with 40th European Conference on Information Retrieval (ECIR 2018), Grenoble, France, March 26, 2018., 2079, 6, 8, CEUR-WS.org, 2018年, [査読有り], [筆頭著者], [国際共著]
研究論文(国際会議プロシーディングス), We develop a novel framework that helps identify potential bias in news websites to support users who are exposed to news articles with a wide variety of political leanings. We propose a polarity-based stance (PS), a vector that represents how often a website publishes articles that are positive or negative with regard to a topic. We derive PS using the GDELT database and visualize the news websites' stances. We demonstrate the utility of our framework via a case study of the 2016 US Presidential Election. - Analysis of COLIEE Information Retrieval Task Data
Masaharu Yoshioka
NEW FRONTIERS IN ARTIFICIAL INTELLIGENCE (JSAI-ISAI 2017), 10838, 5, 19, SPRINGER INTERNATIONAL PUBLISHING AG, 2018年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), The Competition on Legal Information Extraction/Entailment (COLIEE) involves the legal question answering task. The information retrieval task for finding relevant articles to questions is one of the subtasks in COLIEE. In this paper, we compare the characteristics of the test data provided in two different language (English and Japanese) and analyze topic difficulty based on the submission data by using the retrieval results of Indri, a state-of-the-art information retrieval system. We also discuss issues relating to the design of new COLIEE information retrieval tasks. - Measuring Beginner Friendliness of Japanese Web Pages explaining Academic Concepts by Integrating Neural Image Feature and Text Features
Hayato Shiokawa, Kota Kawaguchi, Bingcai Han, Takehito Utsuro, Yasuhide Kawada, Masaharu Yoshioka, Noriko Kando
NATURAL LANGUAGE PROCESSING TECHNIQUES FOR EDUCATIONAL APPLICATIONS, 143, 151, ASSOC COMPUTATIONAL LINGUISTICS-ACL, 2018年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Search engine is an important tool of modern academic study, but the results are lack of measurement of beginner friendliness. In order to improve the efficiency of using search engine for academic study, it is necessary to invent a technique of measuring the beginner friendliness of a Web page explaining academic concepts and to build an automatic measurement system. This paper studies how to integrate heterogeneous features such as a neural image feature generated from the image of the Web page by a variant of CNN (convolutional neural network) as well as text features extracted from the body text of the HTML file of the Web page. Integration is performed through the framework of the SVM classifier learning. Evaluation results show that heterogeneous features perform better than each individual type of features. - WC3: Wikipedia Category Comprehensiveness Checker based on the DBpedia Metadata Database.
Masaharu Yoshioka
Workshop and Poster Proceedings of the 8th Joint International Semantic Technology Conference co-located with the 8th Joint International Semantic Technology Conference (JIST 2018), Awaji City, Hyogo, Japan, November 26-28, 2018., 2293, 98, 101, CEUR-WS.org, 2018年, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス), We demonstrate Wikipedia Category Comprehensiveness Checker (WC3) based on the DBpedia metadata database. This system supports to check comprehensiveness and consistency of Wikipedia category annotation using DBpedia database. This system is available online. - Construction of In-House Papers/Figures Database System for a Paticular Research Domain using PDFs - Application of Nano-Crystal Device Development Domain -
M. Yoshioka, S. Hara
Proccedings of the 2nd International Workshop on Scientific Document Analysis (SCIDOCA 2017), Tokyo, Japan, November 14-15, 2017: Proccedings of the 2nd International Workshop on Scientific Document Analysis (7pp.), 1, 7, 2017年11月, [査読有り]
英語 - WC3: Analyzing the Style of Metadata Annotation Among Wikipedia Articles by Using Wikipedia Category and the DBpedia Metadata Database
Masaharu Yoshioka
KNOWLEDGE GRAPHS AND LANGUAGE TECHNOLOGY, 10579, 119, 136, SPRINGER INTERNATIONAL PUBLISHING AG, 2017年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), WC3 (Wikipedia Category Consistency Checker) is a system that supports the analysis of the metadata-annotation style in Wikipedia articles belonging to a particular Wikipedia category (the subcategory of "Categories by parameter") by using the DBpedia metadata database. This system aims to construct an appropriate SPARQL query to represent the category and compares the retrieved results and articles that belong to the category. In this paper, we introduce WC3 and extend the algorithm to analyze efficiently additional varieties of Wikipedia category. We also discuss the metadata-annotation quality of the Wikipedia by usingWC3. URL ofWC3 is http://wnews.ist.hokudai.ac.jp/wc3/ and related files are available at http://wnews.ist.hokudai.ac.jp/wc3/KEKI. - A Civil Code Article Information Retrieval System based on Phrase Alignment with Article Structure Analysis and Ensemble Approach.
Masaharu Yoshioka, Daiki Onodera
COLIEE 2017. 4th Competition on Legal Information Extraction and Entailment, held in conjunction with the 16th International Conference on Artificial Intelligence and Law (ICAIL 2017) in King's College London, UK., 9, 22, EasyChair, 2017年, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス) - A multi-faceted figure retrieval system from research papers for supporting nano-crystal device development researchers
Masaharu Yoshioka, Tao Zhu, Shinjiroh Hara
The Proceedings of the First International Workshop on ScIentific Document Analysis (SCIDOCA 2016), 2016年11月, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス) - Civil Code Article Information Retrieval System based on Legal Terminology and Civil Code Article Structure
Daiki Onodera, Masaharu Yoshioka
The Proceedings of the 10th International Workshop on Juris-Informatics (JURISIN2016), The Japanese Society of Artificial Intelligence, 2016年11月, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス) - WC3: Analyzing the style of metadata annotation among Wikipedia articles by using Wikipedia category and the DBPedia metadata database.
Masaharu YOSHIOKA
Proceedings of the First Workshop on Knowledge Extraction and Knowledge Integration, 2016年10月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - Interactive Metric Learning-Based Visual Data Exploration: Application to the Visualization of a Scientific Social Network
Masaharu Yoshioka, Masahiko Itoh, Michele Sebag
INFORMATION SEARCH, INTEGRATION, AND PERSONALIZATION, (ISIP 2015), 622, 142, 156, SPRINGER INTERNATIONAL PUBLISHING AG, 2016年, [査読有り], [筆頭著者], [国際共著]
英語, 研究論文(国際会議プロシーディングス), Data visualization is a core approach for understanding data specifics and extracting useful information in a simple and intuitive way. Visual data mining proceeds by projecting multidimensional data onto two-dimensional (2D) or three-dimensional (3D) data, e.g., through mathematical optimization and topology preserved in multidimensional scaling (MDS). However, this projection does not necessarily comply with the user's needs, prior knowledge and/or expectations. This paper proposes an interactive visual mining approach, centered on the user's needs and allowing the modification of data visualization by leveraging approaches from metric learning. The paper exemplifies the proposed system, referred to as Interactive Metric Learning-based Visual Data Exploration (IMViDE), applied to scientific social network browsing. - Comparative Analysis of GDELT Data Using the News Site Contrast System.
Masaharu Yoshioka, Noriko Kando
Proceedings of the First International Workshop on Recent Trends in News Information Retrieval co-located with 38th European Conference on Information Retrieval (ECIR 2016), Padua, Italy, March 20, 2016., 1568, 63, 65, CEUR-WS.org, 2016年, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス), The News Site Contrast (NSContrast) system analyzes news articles retrieved from multiple news sites based on the concept of contrast set mining. It can extract terms that characterize different topics of interest across news sites, countries, and regions. In this study, we used NSContrast to analyze Global Database of Events, Language, and Tone (GDELT) data by comparing news articles from different regions (e.g., USA, Asia, and the Middle East). We also present examples of analyses performed using this system. - NaDev: An annotated corpus to support information extraction from research papers on nanocrystal devices
Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara
Journal of Information Processing, 24, 3, 554, 564, Information Processing Society of Japan, 2016年, [査読有り]
英語, 研究論文(学術雑誌), The process of nanocrystal device development is not well systematized. To support this process, analysis of the information produced by developmental experiments is required. In this study, we constructed an annotated corpus to support the extraction of experimental information from relevant publications. We designed the corpus-construction guidelines by cooperating with a domain expert. We evaluated these guidelines through corpusconstruction experiments with graduate students from this domain, and then evaluated the corpus with the domain expert. In the corpus construction experiments, we achieved a sufficient level of Inter-Annotator Agreement by using a loose agreement measure that ignored the term-boundary mismatch problem, and made an agreement corpus that excluded annotations based on misunderstanding the guidelines. The domain expert evaluated this agreement corpus and modified the guidelines based on real examples. Using these guidelines, we finalized the corpus called "NaDev" (Nanocrystal Device development corpus). The NaDev corpus and its construction guidelines will be released via our website, http://nanoinfo.ist.hokudai.ac.jp/. The NaDev corpus aims to support automatic information extraction from publications relevant to nanocrystal device development. This information can be used to solve problems in the nanotechnology domain using the massive availability of fresh information. To the best of our knowledge, this is the first corpus constructed for the development of nanocrystal devices. - Extraction of Chemical and Drug Named Entities by Ensemble Learning Using Chemical NER Tools Based on Different Extraction Guidelines
Thaer M. Dieb, Masaharu Yoshioka
Transactions on Machine Learning and Data Mining, 8, 2, 61, 76, 2015年10月, [査読有り], [最終著者]
英語, 研究論文(学術雑誌) - Framework for automatic information extraction from research papers on nanocrystal devices
Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara, Marcus C. Newton
BEILSTEIN JOURNAL OF NANOTECHNOLOGY, 6, 1872, 1882, BEILSTEIN-INSTITUT, 2015年09月, [査読有り], [国際共著]
英語, 研究論文(学術雑誌), To support nanocrystal device development, we have been working on a computational framework to utilize information in research papers on nanocrystal devices. We developed an annotated corpus called "NaDev" (Nanocrystal Device Development) for this purpose. We also proposed an automatic information extraction system called "NaDevEx" (Nanocrystal Device Automatic Information Extraction Framework). NaDevEx aims at extracting information from research papers on nanocrystal devices using the NaDev corpus and machine-learning techniques. However, the characteristics of NaDevEx were not examined in detail. In this paper, we conduct system evaluation experiments for NaDevEx using the NaDev corpus. We discuss three main issues: system performance, compared with human annotators; the effect of paper type (synthesis or characterization) on system performance; and the effects of domain knowledge features (e.g., a chemical named entity recognition system and list of names of physical quantities) on system performance. We found that overall system performance was 89% in precision and 69% in recall. If we consider identification of terms that intersect with correct terms for the same information category as the correct identification, i.e., loose agreement (in many cases, we can find that appropriate head nouns such as temperature or pressure loosely match between two terms), the overall performance is 95% in precision and 74% in recall. The system performance is almost comparable with results of human annotators for information categories with rich domain knowledge information (source material). However, for other information categories, given the relatively large number of terms that exist only in one paper, recall of individual information categories is not high (39-73%); however, precision is better (75-97%). The average performance for synthesis papers is better than that for characterization papers because of the lack of training examples for characterization papers. Based on these results, we discuss future research plans for improving the performance of the system. - Detecting bursty topics of correlated news and twitter for government services
Takehito Utsuro, Yusuke Inoue, Takakazu Imada, Masaharu Yoshioka, Noriko Kando
Social Media for Government Services, 135, 149, Springer International Publishing, 2015年01月01日, [査読有り]
英語, 論文集(書籍)内論文, This chapter presents a framework of detecting bursty topics of correlated news and twitter, and discusses how to integrate the framework into government services. Especially, as a specific application of the proposed framework of detecting bursty topics of correlated news and twitter, this chapter gives an example of collecting news and twitter that are related to “the 2012 London Olympic game” and applying the proposed framework. - WC3:Wikipedia Category Consistency Checker based on DBPedia
Masaharu Yoshioka, Rhett Loban
2015 11TH INTERNATIONAL CONFERENCE ON SIGNAL-IMAGE TECHNOLOGY & INTERNET-BASED SYSTEMS (SITIS), 712, 718, IEEE, 2015年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), Wikipedia is a free Internet encyclopedia that covers numerous topics and is maintained by voluntary editors. There have been several efforts to analyze the quality of Wikipedia's content, specifically assessing textual content and user editorial behavior. However, there has been no specific analysis of the quality of structured data (e.g., category structures, attributes contained in infoboxes) in Wikipedia. DBPedia is one of a core part of Linked Open Data database which extracts structured information from Wikipedia. Since the quality of DBPedia depends on Wikipedia, it is beneficial to have a mechanism to keep a consistent style of writing of the structured data (metadata) within Wikipedia. In this paper, we propose a system WC3 (WC-triple: Wikipedia Category Consistency Checker) that uses DBPedia RDF-triple information to evaluate the consistency of the metadata related to the Wikipedia category information. We also illustrate examples of typical inconsistencies that the system can assist in detecting. - The CHEMDNER corpus of chemicals and drugs and its annotation principles
Martin Krallinger, Obdulia Rabal, Florian Leitner, Miguel Vazquez, David Salgado, Zhiyong Lu, Robert Leaman, Yanan Lu, Donghong Ji, Daniel M. Lowe, Roger A. Sayle, Riza Theresa Batista-Navarro, Rafal Rak, Torsten Huber, Tim Rocktaschel, Serergio Matos, David Campos, Buzhou Tang, Hua Xu, Tsendsuren Munkhdalai, Keun Ho Ryu, S. V. Ramanan, Senthil Nathan, Slavko Zitnik, Marko Bajec, Lutz Weber, Matthias Irmer, Saber A. Akhondi, Jan A. Kors, Shuo Xu, Xin An, Utpal Kumar Sikdar, Asif Ekbal, Masaharu Yoshioka, Thaer M. Dieb, Miji Choi, Karin Verspoor, Madian Khabsa, C. Lee Giles, Hongfang Liu, Komandur Elayavilli Ravikumar, Andre Lamurias, Francisco M. Couto, Hong-Jie Dai, Richard Tzong-Han Tsai, Caglar Ata, Tolga Can, Anabel Usie, Rui Alves, Isabel Segura-Bedmar, Paloma Martinez, Julen Oyarzabal, Alfonso Valencia
JOURNAL OF CHEMINFORMATICS, 7, S-1, S2, BMC, 2015年01月, [査読有り], [国際共著]
英語, 研究論文(学術雑誌), The automatic extraction of chemical information from text requires the recognition of chemical entity mentions as one of its key steps. When developing supervised named entity recognition (NER) systems, the availability of a large, manually annotated text corpus is desirable. Furthermore, large corpora permit the robust evaluation and comparison of different approaches that detect chemicals in documents. We present the CHEMDNER corpus, a collection of 10,000 PubMed abstracts that contain a total of 84,355 chemical entity mentions labeled manually by expert chemistry literature curators, following annotation guidelines specifically defined for this task. The abstracts of the CHEMDNER corpus were selected to be representative for all major chemical disciplines. Each of the chemical entity mentions was manually labeled according to its structure-associated chemical entity mention (SACEM) class: abbreviation, family, formula, identifier, multiple, systematic and trivial. The difficulty and consistency of tagging chemicals in text was measured using an agreement study between annotators, obtaining a percentage agreement of 91. For a subset of the CHEMDNER corpus (the test set of 3,000 abstracts) we provide not only the Gold Standard manual annotations, but also mentions automatically detected by the 26 teams that participated in the BioCreative IV CHEMDNER chemical mention recognition task. In addition, we release the CHEMDNER silver standard corpus of automatically extracted mentions from 17,000 randomly selected PubMed abstracts. A version of the CHEMDNER corpus in the BioC format has been generated as well. We propose a standard for required minimum information about entity annotations for the construction of domain specific corpora on chemical and drug entities. The CHEMDNER corpus and annotation guidelines are available at: http://www.biocreative.org/resources/biocreative-iv/chemdner-corpus/ - Automatic Annotation of Parameters from Nanodevice Development Research Papers
T. M. Dieb, M. Yoshioka, S. Hara, M. C. Newton
Proceedings of the 4th International Workshop on Computational Terminology (COMPUTERM 2014), COLING 2014 Workshop, Dublin, Ireland, August 23, 2014: Proceedings of the 4th International Workshop on Computational Terminology, pp. 77-85 (9pp.), 77, 85, 2014年08月, [査読有り], [国際共著]
英語 - Analysis of Japanese Wikipedia Category for Constructing Wikipedia Ontology and Semantic Similarity Measure
Masaharu Yoshioka
INFORMATION RETRIEVAL TECHNOLOGY, AIRS 2014, 8870, 470, 481, SPRINGER-VERLAG BERLIN, 2014年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), Wikipedia is a free encyclopedia on the Internet that contains millions of articles. Wikipedia ontologies (e.g., YAGO2 and the Japanese Wikipedia ontology) have been constructed to utilize the semantic information in this encyclopedia; in these ontologies, the category information from each article is used to construct concept hierarchies. However, Wikipedia categories were originally designed for navigation, to help users find appropriate articles, and they are not equivalent to concept hierarchies in Wikipedia ontologies. In this study, we briefly review the definition of a category in Wikipedia and exhaustively investigate the category structure in the Japanese Wikipedia. We also discuss how category structure information can be utilized to construct an ontology and to calculate a semantic similarity measure. - Ensemble Approach to Extract Chemical Named Entity
Masaharu Yoshioka, Thaer M. Dieb
Proceedings of the fourth BioCreative challenge evaluation workshop, vol. 2,, 162, 167, 2013年10月, [最終著者]
英語, 研究論文(国際会議プロシーディングス) - Bursty Topics in Time Series Japanese / Chinese News Streams and their Cross-Lingual Alignment
Liyi Zheng, Takehito Utsuro, Masaharu Yoshioka
Proceedings of the 13th Conference of the Pacific Association for Computational Linguistics, 2013年09月, [査読有り]
研究論文(国際会議プロシーディングス) - Query Classification by Using Named Entity Recognition Systems and Clue Keywords
Masaharu Yoshioka
Proceedings of the 10th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Quesiton Answering, And Cross-Lingual Information Access,, 255, 259, National Institute of Informatics (NII), 2013年06月, [査読有り]
英語 - Issues for linking geographical open data of GeoNames and Wikipedia
Masaharu Yoshioka, Noriko Kando
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 7774, 375, 381, Springer, 2013年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), It is now possible to use various geographical open data sources such as GeoNames and Wikipedia to construct geographic information systems. In addition, these open data sources are integrated by the concept of Linked Open Data. There have been several attempts to identify links between existing data, but few studies have focused on the quality of such links. In this paper, we introduce an automatic link discovery method for identifying the correspondences between GeoNames entries and Wikipedia pages, based on Wikipedia category information. This method finds not only appropriate links but also inconsistencies between two databases. Based on this integration results, we discuss the type of inconsistencies for making consistent Linked Open Data. © Springer-Verlag 2013. - Time Series Topic Modeling and Bursty Topic Detection of Correlated News and Twitter.
Daichi Koike, Yusuke Takahashi, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando
Sixth International Joint Conference on Natural Language Processing, IJCNLP 2013, Nagoya, Japan, October 14-18, 2013, 917, 921, Asian Federation of Natural Language Processing / ACL, 2013年, [査読有り] - Construction of a Japanese gazetteers for Japanese local toponym disambiguation
Masaharu Yoshioka, Takahiro Fujiwara
Proceedings of the 7th Workshop on Geographic Information Retrieval, GIR 2013, 57, 63, Association for Computing Machinery, 2013年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス), When processing toponym information in natural language text, it is crucial to have a good gazetteers. There are several well-organized gazetteers for English text, but they do not cover Japanese local toponyms. In this paper, we introduce a Japanese gazetteers based on Open Data (e.g., the Toponym database distributed by Japanese ministries, Wikipedia, and GeoNames) and propose a toponym disambiguation framework that uses the constructed gazetteers. We also evaluate our approach based on a blog corpus that contains place names with high ambiguity. - Issues for Linking Geographical Open Data of GeoNames and Wikipedia
Masaharu Yoshioka, Noriko Kando
Proceedings of the 2nd Joint International Semantic Technology Conference (JIST2012),, 2012年12月, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス) - Cross-Lingual Topic Alignment in Time Series Japanese / Chinese News
Shuo Hu, Yusuke Takahashi, Liyi Zheng, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando, Tomohiro Fukuhara, Hiroshi Nakagawa, Yoji Kiyota
Proceedings of the 26th Pacific Asia Conference on Language, Information and Computation, 532, 541, 2012年11月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - Wikipediaカテゴリを用いたWikipediaとGeoNames間のリンク発見とメンテナンス
吉岡 真治, 劉 亦奇, 神門 典子
情報処理学会論文誌. データベース, 5, 3, 141, 148, 一般社団法人情報処理学会, 2012年09月, [査読有り], [筆頭著者]
日本語, 研究論文(学術雑誌), 近年,地理情報を扱う情報システムの増加にともない,地理情報に関するデータベースへのニーズが高まっている. GeoNames は, Open Data としては,最大規模の地理情報データベースである.本データベースを Linked Open Data として Wikipedia の情報を媒介として関連づけることにより, Web Ontology の開発などに役立てられている.ただし, GeoNames と Wikipedia の間のリンクについては,自動的なリンク発見の試みがいくつか行われているものの,十分な数のリンクが付与されている状態ではない.本論文では, Wikipedia のカテゴリ情報を使うことで,精度良く Wikipedia のページに対応する GeoNames のエントリを発見する方法を提案する.また,本手法は,既存のリンク中の不適切なリンクを発見する際にも利用可能であることを示す.本手法の成果については,すでに, GeoNames の管理者に報告しており,その成果の一部は, GeoNames 中のリンク情報として公開・修正が行われている. - Applying a burst model to detect bursty topics in a topic model
Yusuke Takahashi, Takehito Utsuro, Masaharu Yoshioka, Noriko Kando, Tomohiro Fukuhara, Hiroshi Nakagawa, Yoji Kiyota
Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 7614, 239, 249, Springer, 2012年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), This paper focuses on two types of modeling of information flow in news stream, namely, burst analysis and topic modeling. First, when one wants to detect a kind of topics that are paid much more attention than usual, it is usually necessary for him/her to carefully watch every article in news stream at every moment. In such a situation, it is well known in the field of time series analysis that Kleinberg's modeling of bursts is quite effective in detecting burst of keywords. Second, topic models such as LDA (latent Dirichlet allocation) are also quite effective in estimating distribution of topics over a document collection such as articles in news stream. However, Kleinberg's modeling of bursts is usually applied only to bursts of keywords but not to those of topics. Considering this fact, we propose how to apply Kleinberg's modeling of bursts to topics estimated by a topic model such as LDA and DTM (dynamic topic model). © 2012 Springer-Verlag Berlin Heidelberg. - Automatic information extraction of experiments from nanodevices development papers
Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara
Proceedings of the 2012 IIAI International Conference on Advanced Applied Informatics, IIAIAAI 2012, 42, 47, 2012年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), To support development processes for nanodevices, we want to utilize the information related to experiments from nanodevice development research papers. In this paper, we propose a new guideline for constructing a tagged corpus of nanodevice development papers to achieve this goal. We also propose the use of a corpus construction support tool. To speed up the construction process, we propose an approach for automatic extraction of experiment-related information from the papers. © 2012 IEEE. - Multifaceted analysis of news articles by using semantic annotated information
Masaharu Yoshioka, Noriko Kando
International Conference on Information and Knowledge Management, Proceedings, 19, 20, 2012年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), We propose a novel framework that enables multifaceted analysis of news articles. This system uses semantic annotated information (e.g., person, place) as facets and can be used to construct structured queries for comparing the differences between sets of articles. - Multifaceted Analysis of News Articles by Using Semantic Annotated Information
Masaharu Yoshioka, Noriko Kando
PROCEEDINGS OF THE FIFTH WORKSHOP ON EXPLOITING SEMANTIC ANNOTATIONS IN INFORMATION RETRIEVAL, 19, +, ASSOC COMPUTING MACHINERY, 2012年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), We propose a novel framework that enables multifaceted analysis of news articles. This system uses semantic annotated information (e. g., person, place) as facets and can be used to construct structured queries for comparing the differences between sets of articles. - 質問応答のための情報検索への応用を目的とした確率型検索モデルとブーリアン検索モデルの組合せ
吉岡 真治
情報処理学会論文誌, 52, 12, 3423, 3434, 情報処理学会, 2011年12月15日
日本語, 効率的な文書データベースに基づいた質問応答システムを構築するためには,情報検索システムの性能の向上が不可欠である.ここで,特定の人や組織に関する質問応答を目的とする場合を考えると,対象となる文書に,これらの人や組織に関する情報が入っていることは不可欠であり,ブーリアン検索モデルに基づいた検索式を利用することが望ましい場合がある.本研究では,人名や組織名に多く存在すると考えられる表記バリエーションのリストと動詞の同義語を考慮することによって,質問応答を考慮した適切なブーリアン検索式を構築するとともに,確率型検索モデルとブーリアン検索モデルを組み合わせた情報検索システムABRIR(Appropriate Boolean query Reformulation for Information Retrieval)を利用したシステムを提案する.また,本システムを地理情報などに関する質問応答のタスクであるNTCIR-8 GeoTimeタスクに適用し,その有効性を検証した.In order to make a good question answering (QA) system based on text database, it is better to have a good information retrieval (IR) system. To make a good IR system for QA about particular named entities, it is better to use Boolean IR model by using appropriate Boolean query. In this paper, we propose to use ABRIR (Appropriate Boolean query Reformulation for Information Retrieval) that constructs appropriate Boolean query by using list of synonyms and variation of Japanese katakana description. Evaluation results shows that ABRIR works effectively for the task of IR for QA (NTCIR-8 Geotime). - 質問応答のための情報検索への応用を目的とした確率型検索モデルとブーリアン検索モデルの組合せ
吉岡 真治
情報処理学会論文誌, 52, 12, 3423, 3434, 一般社団法人情報処理学会, 2011年12月, [査読有り]
日本語, 研究論文(学術雑誌), 効率的な文書データベースに基づいた質問応答システムを構築するためには,情報検索システムの性能の向上が不可欠である.ここで,特定の人や組織に関する質問応答を目的とする場合を考えると,対象となる文書に,これらの人や組織に関する情報が入っていることは不可欠であり,ブーリアン検索モデルに基づいた検索式を利用することが望ましい場合がある.本研究では,人名や組織名に多く存在すると考えられる表記バリエーションのリストと動詞の同義語を考慮することによって,質問応答を考慮した適切なブーリアン検索式を構築するとともに,確率型検索モデルとブーリアン検索モデルを組み合わせた情報検索システムABRIR(Appropriate Boolean query Reformulation for Information Retrieval)を利用したシステムを提案する.また,本システムを地理情報などに関する質問応答のタスクであるNTCIR-8 GeoTimeタスクに適用し,その有効性を検証した. - Evaluation of Interactive Information Access System using Concept Map
Masaharu Yoshioka, Noriko Kando, Yohei Seki
Proceedings of the 4th International Workshop on Evaluating Information Access (EVIA), A Satellite Workshop of NTCIR-9, December 6, 2011 Tokyo Japan, 20, 23, National Institute of Informatics (NII), 2011年, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - A Micro-analysis of Topic Variation for a Geotemporal Query
Fredric C. Gey, Ray R. Larson, Jorge Machado, Masaharu Yoshioka
Proceedings of the 4th International Workshop on Evaluating Information Access (EVIA), A Satellite Workshop of NTCIR-9, December 6, 2011 Tokyo Japan, 9, 13, National Institute of Informatics (NII), 2011年, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - Construction of tagged corpus for Nanodevices development papers
Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara
Proceedings - 2011 IEEE International Conference on Granular Computing, GrC 2011, 167, 170, IEEE, 2011年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Nanodevices development process is not well systematized. In order to support this development process, we have been working on an experimental record management system that aims at analyzing previous manufacturing experiments to provide an insight on future manufacturing. However, we found that experimental records do not have enough information for detailed analysis. In this paper, we propose an approach to extract extra information (metadata) from Nanodevices development papers that can enhance the analysis of experimental results. © 2011 IEEE. - ABRIR at NTCIR-9 GeoTime Task Usage of Wikipedia and GeoNames for Handling Named Entity Information.
Masaharu Yoshioka
Proceedings of the 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-9, National Center of Sciences, Tokyo, Japan, December 6-9, 2011, National Institute of Informatics (NII), 2011年, [査読有り] - NTCIR9-GeoTime Overview - Evaluating Geographic and Temporal Search: Round 2.
Fredric C. Gey, Ray R. Larson, Jorge Machado, Masaharu Yoshioka
Proceedings of the 9th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-9, National Center of Sciences, Tokyo, Japan, December 6-9, 2011, National Institute of Informatics (NII), 2011年, [査読有り] - Knowledge exploratory project for nanodevice design and manufacturing
Masaharu Yoshioka, Katsuhiro Tomioka, Shinjiroh Hara, Takashi Fukui
iiWAS2010 - 12th International Conference on Information Integration and Web-Based Applications and Services, 871, 874, ACM, 2010年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), We are developing a framework for knowledge creation in nanodevice development, based on collaboration between nanodevice engineers and computer science researchers. Development of nanodevices requires a variety of knowledge
some of this knowledge is tacit, based on the user's experience. Therefore, it is difficult to become a good engineer in this development process. We propose the concept of "Evidence-based experiment planning" and develop a process for supporting experiment planning in nanodevice development. This system applies knowledge discovery techniques to records of previous experiments to extract experienced engineers' tacit knowledge. Copyright 2010 ACM. - Extracting Concerns and Reports on Crimes in Blogs
Yusuke Abe, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa, Yoji Kiyota, Masatoshi Tsuchiya
ACTIVE MEDIA TECHNOLOGY, 6335, 498, +, SPRINGER-VERLAG BERLIN, 2010年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for those who are not familiar with tips for preventing being victimized. This paper proposes a framework of extracting people's concerns and reports on crimes in their own blogs. In this framework, we solve two tasks. In the first task, we focus on experts in crime domain and address the issue of extracting concerns on crimes such as tips for preventing being victimized. In the evaluation of this first task, we show that we successfully rank expert bloggers high in the results of blog feed retrieval. In the second task, on the other hand, we focus on victims of criminal acts, and address the issue of extracting reports on being victimized In the evaluation of this second task, we show that we outperform blog post ranking based on the search engine API by incorporating dependency relations for identifying victims' blog posts. - On a Combination of Probabilistic and Boolean IR Models for Question Answering
Masaharu Yoshioka
INFORMATION RETRIEVAL TECHNOLOGY, 6458, 588, 598, SPRINGER-VERLAG BERLIN, 2010年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), To make a good question answering (QA) system based on a text database, it is preferable to have a good information retrieval (IR) system that can find appropriately relevant document sets for a given query. To make a good IR system for QA about particular named entities (NEs), it is preferable to use a Boolean IR model that uses appropriate Boolean queries with the NE information. In this paper, we propose to use appropriate Boolean query reformulation for information retrieval (ABRIR) for this problem. In this system, an appropriate list of synonyms and variations of Japanese katakana descriptions of a given query are used to construct the Boolean query. Evaluation results show that ABRIR works effectively for the IR. task in QA. - Cross-Lingual Analysis of Concerns and Reports on Crimes in Blogs
Hiroyuki Nakasaki, Yusuke Abe, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa, Yoji Kiyota
Lecture Notes of the Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering, 40, 315, 320, Springer, 2010年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for outsiders from abroad who are not familiar with cultures and crimes in foreign countries. This paper proposes a framework of cross-lingually analyzing people's concerns, reports, and experiences on crimes in their own blogs. In the retrieval of blog feeds/posts, we take two approaches, focusing on various types of bloggers such as experts in the crime domain and victims of criminal acts. © Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering 2010. - On a Combination of Probabilistic and Boolean IR Models for GeoTime Task.
Masaharu Yoshioka
Proceedings of the 8th NTCIR Workshop Meeting on Evaluation of Information Access Technologies: Information Retrieval, Question Answering and Cross-Lingual Information Access, NTCIR-8, National Center of Sciences, Tokyo, Japan, June 15-18, 2010, 154, 158, National Institute of Informatics (NII), 2010年, [査読有り] - NSContrast: An Exploratory News Article Analysis System that Characterizes the Differences between News Sites
Masaharu Yoshioka
SIGIR2009 Workshop on Information Access in a Multilingual World, 25, 29, 2009年07月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - NSContrast: Characterizing the Difference of Interest among Multiple News Sites
Masaharu Yoshioka
INTERACT 2009 Workshop on Culture and Technologies for Social Interaction, http://sites.google.com/site/crosscultureworkshopinteract09/position-papers-1/10-Yoshioka.pdf-29, 2009年, [査読有り], [筆頭著者]
英語, 研究論文(国際会議プロシーディングス) - Web content summarization using social bookmarks: a new approach for social summarization
K. Takahashi, A. Sugiyama, Y. Shimomura, T. Tateyama, R. Chiba, M. Yoshioka, H. Takeda
WIDM '08: Proceeding of the 10th ACM workshop on Web information and data management, 103, 110, 2008年10月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - 情報爆発時代におけるわくわくするITの創出を目指して : パートI : 情報爆発時代における新しい基盤技術 : 1.キーワードサーチを超える情報爆発サーチ -自然言語処理で価値ある未知をマイニング-
鳥澤 健太郎, 中川 裕志, 黒橋 禎夫, 乾 健太郎, 吉岡 真治, 藤井 敦, 喜連川 優
情報処理, 49, 8, 890, 896, 一般社団法人情報処理学会, 2008年08月15日
日本語 - Web情報を用いた設計知識情報データベースの拡充手法
高橋潔考, 下村芳樹, 舘山武史, 吉岡真治, 武田英明
日本機械学会設計工学・システム部門講演会論文集(CD-ROM), 18th, 575, 578, 2008年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Recently, designers have been required solving comprehensive problem becoming greater and more complicated. In relation to this background, we have proposed Universal Abduction Studio (UAS)
a computer environment that synthetically supports creative design. However, it is difficult for a designer to manually acquire multiple domain knowledge required for UAS. Therefore, we propose a Web-based knowledge database construction method for supporting design by UAS in this paper. © 2008 ACM. - IR Interface for Contrasting Multiple News Sites
Masaharu Yoshioka
Proceedings of the Asia Information Retrieval Symposium 2008, -, -, 516, 521, 2008年01月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - Analyzing Multiple News Sites by Contrasting Articles
Masaharu Yoshioka
SITIS 2008: 4TH INTERNATIONAL CONFERENCE ON SIGNAL IMAGE TECHNOLOGY AND INTERNET BASED SYSTEMS, PROCEEDINGS, 45, 51, IEEE COMPUTER SOC, 2008年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Today, there is access to large numbers of news sites in different countries, and there are several experimental systems, such as Newsblaster and NewsExplorer that integrate news articles about a particular event from multiple news sites. These systems enable a good understanding of particular events by using multiple news sites, but they ignore the characteristics of the various news sites. To characterize the differences between news sites, the News Site Contrast (NSContrast) system has been proposed. This system analyzes multiple news sites using the concept of contrast-set mining. However NSContrast has only limited analysis functions and is not mature enough for evaluation via user experiments. Therefore, in this paper, we analyze contrast set mining results for NSContrast, aiming to understand the requirements for extracting useful information that also reflects the interests of different countries. Based on this analysis, a new NSContrast is introduced and applied to a news article database constructed from multiple news sites in different countries for user experimentation. - Web-Based Knowledge Database Construction Method for Supporting Design
Kiyotaka Takahashi, Aki Sugiyama, Yoshiki Shimomura, Takeshi Tateyama, Ryosuke Chiba, Masaharu Yoshioka, Hideaki Takeda
PRACTICAL ASPECTS OF KNOWLEDGE MANAGEMENT, PROCEEDINGS, 5345, 173, +, SPRINGER-VERLAG BERLIN, 2008年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), In recent years, comprehensive problem solving by artefact designers has been required as demands related to artefacts become greater and more complicated. In relation to this background, we have proposed Universal Abduction Studio (UAS), a computer environment that synthetically supports a creative design. However, in general, it is difficult for a designer to acquire multiple domain knowledge because this knowledge is accumulated manually. This paper proposes a Web-based knowledge database construction method for supporting design using UAS. - 人間の知的活動支援へのアプローチ特集[インテリジェンス系]マイナーなテキスト情報をも活用する情報アクセス技術
吉岡真治
ヒューマンインタフェース学会誌, 9, 4, 269-274, 2007年11月, [招待有り]
日本語, 研究論文(学術雑誌) - アブダクションによる創造的設計支援
武田 英明, 下村 芳樹, 吉岡 真治
設計工学 = JOURNAL OF JAPAN SOCIETY FOR DESIGN ENGINEERING, 42, 10, 558, 564, 日本設計工学会, 2007年10月05日
日本語 - Tagging for intelligent processing of design information
Hideaki Takeda, Yutaka Fujimoto, Masaharu Yoshioka, Yoshiki Shimomuraz, Kengo Morimoto, Wataru Oniki
NEW FRONTIERS IN ARTIFICIAL INTELLIGENCE, 3609, -, 216, +, SPRINGER-VERLAG BERLIN, 2007年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), This paper describes how to add tags to design documents in order to extract knowledge from information for intelligent design support. Our project called Universal Abduction Studio (UAS) aims to build a new design support system that supports conceptual design by dynamically integrating knowledge in different design domains. This paper focuses on knowledge description form which can be used to capture knowledge from text-based information and then be used for inference for creative design. We propose so-called design knowledge document containing both human-readable texts and machine-readable knowledge such as propositions and rules. - Evaluating topic difficulties from the viewpoint of query term expansion
Masaharu Yoshioka
INFORMATION RETRIEVAL TECHNOLOGY, PROCEEDINGS, 4182, 390, 403, SPRINGER-VERLAG BERLIN, 2006年, [査読有り]
英語, 研究論文(学術雑誌), Query term expansion is an important technique for achieving higher retrieval performance. However, since many factors affects the quality of this technique, it is difficult to evaluate this technique in isolation. Feature quantities that characterize the quality of the initial query are defined in this study for evaluating topic difficulties from the viewpoint of query term expansion. I also briefly review the result of the NTCIR-5 query term expansion subtask that uses these quantities for evaluating the effectiveness of the query term expansion techniques. I also describe detailed analysis results on the effect of query term expansion based on topic-by-topic analysis. - アブダクションに基づく設計者支援環境の基本構想
下村 芳樹, 吉岡 真治, 武田 英明, 冨山 哲男
日本機械学会論文集 C編, 72, 713, 274, 281, 一般社団法人 日本機械学会, 2006年
日本語, This paper describes a new design support system that supports conceptual or creative design by dynamically integrating knowledge in different design domains. We argue that abduction for integrating theories can be a basic principle to formalize such design processes. Based on this principle, we propose Universal Abduction Studio, a design environment in which designers combine different theories to arrive at better design. In this new approach to computational support of conceptual design, the system should offer various types of abductive reasoning from which designers can select an interesting design method. We also discuss technologies to implement UAS and in this paper we propose to use analogical reasoning as abductive reasoning to discover relationships between knowledge from different sources. We demonstrate that a prototype system can discover a new idea in a design example taken from a real design activity. - 検索語の網羅性に注目した汎化概念により検索語選択支援を行う情報検索システムの研究
吉岡 真治, 原口 誠
人工知能学会論文誌 = Transactions of the Japanese Society for Artificial Intelligence : AI, 20, 4, 270, 280, 一般社団法人 人工知能学会, 2005年11月01日
日本語, It is not easy for a user of an Information Retrieval (IR) system to select an appropriate keyword set to represent his or her specific information need. Therefore, many IR systems can modify keyword sets by estimating the user's particular requirement. Even though such IR systems have better retrieval performance, the complicated estimation process entailed by a large number of keywords makes it difficult for a user to understand how the system behaves. Therefore, we used a thesaurus for query expansion. To select an appropriate keyword set, we proposed two concepts: ``adaptive generalization'', which estimates an appropriate generalization level of the given keywords by using relevant document information, and ``purpose-oriented concept structure modification'', which selects relevant keywords from a predefined synonym set in a thesaurus. Because query expansion based on a thesaurus aims to find new keywords that are complementary to the initial keywords, we proposed to use this method to construct a Boolean query formula to represent the user's information need. We proposed a new IR system called ``appropriate Boolean query reformulation for IR with adaptive generalization'' (ABRIR-AG) to support Boolean query formation. In ABRIR-AG, we reformulated a user-given Boolean query by using a small number of relevant documents. Finally, to evaluate its effectiveness, we evaluated ABRIR-AG by using a large-scale test collection containing WWW documents. - An Architecture for Designers' Support Systems with Knowledge-embedded Documents
Hideaki Takeda, Masaharu Yoshioka, Yoshiki Shimomura, Yutaka Fujimoto, Kengo Morimoto, Wataru Oniki
Proceedings of the 15th International Conference on Engineering Design -ICED05- (CD-ROM), 2005年, [査読有り] - An appropriate Boolean query reformulation interface for information retrieval based on adaptive generalization
M Yoshioka, M Haraguchi
International Workshop on Challenges in Web Information Retrieval and Integration, Proceedings, 145, 150, IEEE COMPUTER SOC, 2005年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), When implementing an IR system that can support comprehensive searches from a wide variety of documents, it is crucial to have a mechanism for selecting appropriate query formulations. For this purpose, many IR systems can modify query terms by estimating the user's information need. However because modified query terms are usually represented in a complicated form, it is difficult to judge how appropriate they are. In this research, we assume all relevant documents should contain words that correspond to concepts that the user would like to retrieve. Therefore, a Boolean query formula is one good way to represent a user's information need with high readability. To find the required concepts in a relevant document set, we have previously proposed a new IR system that calculates appropriate generalized concepts to represent the user's need. In this study, we implement a user interface that supports reformulation of IR queries by using abstract concepts. - On a combination of probabilistic and Boolean IR models for WWW document retrieval
Masaharu Yoshioka, Makoto Haraguchi
ACM Transactions on Asian Language Information Processing, 4, 3, 340, 356, 2005年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), Even though a Boolean query can express the information need precisely enough to select relevant documents, it is not easy to construct an appropriate Boolean query that covers all relevant documents. To utilize a Boolean query effectively, a mechanism to retrieve as many as possible relevant documents is therefore required. In accordance with this requirement, we propose a method for modifying a given Boolean query by using information from a relevant document set. The retrieval results, however, may deteriorate if some important query terms are removed by this reformulation. A further mechanism is thus required in order to use other query terms that are useful for finding more relevant documents, but are not strictly required in relevant documents. To meet this requirement, we propose a new method that combines the probabilistic IR and the Boolean IR models. We also introduce a new IR system - called appropriate Boolean query reformulation for information retrieval (ABRIR) - based on these two methods and the Okapi system. ABRIR uses both a word index and a phrase index formed from combinations of two adjacent noun words. The effectiveness of these two methods was confirmed according to the NTCIR-4 Web test collection. © 2005 ACM. - Towards construction of evaluation framework for query expansion
M Yoshioka
INFORMATION RETRIEVAL TECHNOLOGY, PROCEEDINGS, 3689, 647, 652, SPRINGER-VERLAG BERLIN, 2005年, [査読有り]
英語, 研究論文(学術雑誌), Query expansion is an important technique for achieving higher retrieval performance. However, a good framework for evaluating this technique in isolation does not, exist because the effect of query expansion depends on the quality of the initial query. Feature quantities that characterize the quality of the initial query are defined in this study. Correlations between these quantities and retrieval performance were analyzed using the NTCIR-4 web test collection. - Physical concept ontology for the knowledge intensive engineering framework
M Yoshioka, Y Umeda, H Takeda, Y Shimomura, Y Nomaguchi, T Tomiyama
ADVANCED ENGINEERING INFORMATICS, 18, 2, 95, 113, ELSEVIER SCI LTD, 2004年04月, [査読有り]
英語, 研究論文(学術雑誌), Knowledge intensive engineering aims at flexible applications of a variety of product life cycle knowledge. much as design, manufacturing. operations, maintenance, and recycling. Many engineering domain theories are organized and embedded within CAD and CAE tools and engineering activities can be formalized as modeling operations to them. Since most of domain theories deal with the physical world and can be associated with physical concepts. a physical concept ontology can form a common ontology to integrate engineering models that are formed based on domain theories. This paper reports a physical ontology-based support system for knowledge intensive engineering called Knowledge intensive Engineering Framework (KIEF) to integrate multiple engineering models and to allow more flexible use of them. First the paper describes the physical ontology as the core of KIEF and an ontology-based reasoning system called a pluggable metamodel mechanism, to integrate and maintain relationships among these models. The pluggable metamodel mechanism uses a metamodel that represents the designer's mental model about a design object as a concept network model. The designer builds and decomposes a functional hierarchy from functional specifications with an FBS (Function-Behavior-State) modeler. He/She then maps the functional hierarchy into a metamodel using physical features that are building blocks for conceptual design. Then, the pluggable metamodel mechanism enriches the information contained in the metamodel by using causal dependency knowledge about the physical world and by budding and analzing various engineering models. We demonstrate the power of KIEF by illustrating a design case performed on KIEF. (C) 2004 Published by Elsevier Ltd. - A methodology for IR query clarification based on adaptive generalization
M Yoshioka, M Haraguchi
8TH WORLD MULTI-CONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL I, PROCEEDINGS, I, 226, 230, INT INST INFORMATICS & SYSTEMICS, 2004年
英語, 研究論文(国際会議プロシーディングス), We can use various types of information retrieval (IR) system to access large quantities of text data. These systems usually request users to input keywords to represent their retrieval intention. Since, it is difficult for a user to select appropriate keywords, many IR systems have the capability of modifying keywords by estimating the user's intention. However because modified keywords are usually represented in a complicated form, it is difficult to judge how appropriate they are. In this research, we assume all relevant documents should have words that correspond to concepts that the user would like to retrieve. Therefore, a boolean query formula is one good way to represent user's intent with higher readability. In order to find out these concepts in a relevant document set, we have already proposed a new IR system that calculates appropriate generalized concept to represent user's intention. In this study, we implement a user interface that supports to clarify IR query by using abstract concepts. - Towards constructing story databases using maximal analogies between stories
M Yoshioka, M Haraguchi, A Mizoe
INTUITIVE HUMAN INTERFACES FOR ORGANIZING AND ACCESSING INTELLECTUAL ASSETS, 3359, 243, 255, SPRINGER-VERLAG BERLIN, 2004年, [査読有り]
英語, 研究論文(学術雑誌), In order to construct story databases, it is crucial to have an effective index that represents the plot and event sequences in a document. For this purpose, we have already proposed a method using the concept of maximal analogy to represent a generalized event sequence of documents with a maximal set of events. However, it is expensive to calculate a maximal analogy from documents with a large number of sentences. Therefore, in this paper, we propose an efficient algorithm to generate a maximal analogy, based on graph theory, and we confirm its effectiveness experimentally. We also discuss how to use a maximal analogy as an index for a story database, and outline our future plans. - Universal abduction studio -- proposal of a design support environment for creative thinking in design --
Hideaki Takeda, Hiromitsu Sakai, Yutaka Nomaguchi, Masaharu Yoshioka, Yoshiki Shimomura, Tetsuo Tomiyama
A. Folkman, K. Gralen, M. Norell, and U. Sellgren, editors, The Fourteenth International Conference on Engineering Design (ICED 03), Stockholm, August 2003, 2003年08月, [査読有り]
英語 - Construction of Personalized and Purpose-Oriented Thesaurus
YOSHIOKA M.
Proceedings of Asian Association for Lexicography '03 (ASIALEX), 461, 466, 2003年 - Towards an organization and access method of story databases
M Haraguchi, M Yotsutani, M Yoshioka
7TH WORLD MULTICONFERENCE ON SYSTEMICS, CYBERNETICS AND INFORMATICS, VOL V, PROCEEDINGS, V, 213, 216, INT INST INFORMATICS & SYSTEMICS, 2003年
英語, 研究論文(国際会議プロシーディングス), To classify a document set from various viewpoints, we extract a possible abstract document from given similar documents. The abstract one is a common generalization of the original documents. Although we can present an efficient algorithm to find it under some pruning rule, it is generally very hard to perform such a task of extracting abstract documents. It is therefore necessary to reduce the numbers of events appearing in documents. For this purpose, we regard one document as a network of events, present a pseudo-PageRank model for calculating the importance of events, analyze and compare it with a standard text summarization method, and finally reports the present approach to improve the pseudo-PageRank. - Knowledge Management System for Problem Solving: Integration of Document Information and Formalized Knowledge
Masaharu Yoshioka, Yasuhiro Shamoto
Volume 1: 23rd Computers and Information in Engineering Conference, Parts A and B, ASMEDC, 2003年01月01日, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス), In engineering activities various types of problems have to be solved. Most of these problems are routine problems and some are complicated problems for which it is difficult to formalize all the problem-solving processes. We propose a knowledge management system for supporting these problem solving processes. One example is using information applicable to new and complicated problems that has resulted from solving similar problems in the past. In addition, in such complicated problem solving processes, most of the decomposed sub-problems can be handled as routine problems. In this paper, we propose use of formalized knowledge and document information that represents the history of problem-solving processes to support the solution of both types of problem. For that purpose, we propose the Documentation Management system for Problem Solving (DMaPS), which supports a user solving a problem by document processing. In this support process, the system retrieves related documents for the user’s problems using formalized knowledge and information retrieval techniques. After retrieving related documents, the user modifies them to fit their problem. The modified information is associated with the formalized knowledge and is stored as documents for future reuse. - Abduction for Creative Design
Tetsuo Tomiyama, Hideaki Takeda, Masaharu Yoshioka, Yoshiki Shimomura
Computational Synthesis: From Basic Building Blocks to High Level Functionality Papers from the 2003 AAAI Symposium, 239, 246, 2003年
研究論文(国際会議プロシーディングス) - Abduction for creative design
Tetsuo Tomiyama, Hideaki Takeda, Masaharu Yoshioka, Yoshiki Shimomura
Proceedings of the ASME Design Engineering Technical Conference, 3, 543, 552, 2003年, [査読有り]
研究論文(国際会議プロシーディングス), While abduction is considered crucial for design in general, this paper focuses on the role of abduction to integrate knowledge assuming that creative design can come from innovative combination of existing knowledge. Based on Schurz's classification of abductive reasoning, the paper identifies that abduction for integrating theories can be performed by a special type of abduction called second order existential abduction. The paper then analyzes refrigerator design cases to understand how knowledge is used and shows that abduction is indeed central to design. It also discusses that knowledge structure is a key concept in abduction for integration. - Development of an information retrieval system suitable for large-scale scholarly databases
Oyama, K., Kageura, K., K, o, N., Kimura, M., Maruyama, K., Yoshioka, M., Takahashi, K.
Systems and Computers in Japan, 34, 6, 44, 56, 2003年01月, [査読有り]
英語, 研究論文(学術雑誌) - 語彙概念構造を利用した複合名詞内の係り関係の解析
竹内 孔一, 内山 清子, 吉岡 真治, 影浦峡, 小山 照夫
情報処理学会論文誌, 43, 5, 1446, 1456, 一般社団法人情報処理学会, 2002年05月15日
日本語, 本研究では,主辞がサ変名詞である複合名詞の語構成において,構成する単語間の係り関係を支配する語彙的性質に着目し,それに基づく複合名詞解析モデルの作成を試みる.主辞がサ変名詞の複合名詞内の係り関係の解析は,並列関係の場合を除くと,主辞であるサ変名詞の項関係なのか修飾なのかを同定することが解析の第1歩である.項関係とは名詞が動詞の目的語や主語といった関係であることを意味している.本論文では,この関係をとらえる方法として,語彙概念構造を利用した動詞の分類と,その構造を利用した名詞の分類に基づく複合名詞解析手法を提案する.情報処理関連の専門用語と新聞記事中の一般的な複合名詞に対してテスト的な実験を行った.その結果,平均で1231語の複合名詞対して約99.4%の複合名詞を正しく解析する結果を得た.In this paper,we describe a principled approach for analyzing relations between constituent words of compound nouns,specifically those whose heads are deverbal nouns,based on the classification of deverbal nouns by their lexical conceptual structure (LCS) and the classification of nouns in modifier position vis-a-vis LCS of head deverbal nouns.There are two kinds of relations of compounds with head deverbal nouns.The one is that a modifier noun becomes an argument of deverbal head and the other is that a modifier becomes an adjunct.It is an important starting point for analyzing relations to disambiguate the two kinds of relations.Through the qualitative analysis of the data and the experimental evaluation of 1231 compound nouns, we show that the use of LCS as the theoretical basis is very promising for constructing compound analyzer. - 参加者から見たNTCIR(<特集>NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
小川 泰嗣, 佐々木 裕, 増山 繁, 村田 真樹, 吉岡 真治, Yasushi Ogawa, Yutaka Sasaki, Shigeru Masuyama, Masaki Murata, Masaharu Yoshioka
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 17, 3, 306, 311, 人工知能学会, 2002年05月01日
日本語 - 人工物工学研究の展開 第18報 -Universal Abduction Studioの提案-
坂井宏充, 野間口大, 吉岡真治, 武田英明, 下村芳樹, 冨山哲男
日本機械学会第12回設計工学・システム部門講演会講演論文集, 2002年04月
日本語, 研究論文(その他学術会議資料等) - Document-based Design Process Knowledge Management for Knowledge Intensive Engineering
Y. Nomaguchi, M. Yoshioka, T. Tomiyama
From Knowledge Intensive CAD to Knowledge Intensive Engineering, Kluwer Academic Publishers, 2002年04月, [査読有り]
英語, 研究論文(学術雑誌) - 大規模テストコレクションNTCIR-2の構築 -対話型追加検索と言語横断的プーリングの効果
栗山 和子, 吉岡 真治, 神門 典子
情報処理学会論文誌データベース(TOD), 43, 2, 48, 59, 一般社団法人情報処理学会, 2002年03月15日
日本語, 大規模テストコレクションNTCIR-2 の正解文書リストは,NTCIR ワークショップ2 において各参加者から提出された検索結果を用いて,プーリング法に基づいて作成された.本稿では,NTCIR-2の正解文書リストの作成過程において行われた,言語横断的プーリング,および対話型検索システムを用いた追加検索が,検索システムのNTCIR-2 を用いた相対的評価にどのような影響を与えるかを考察する.また,プーリングに参加しなかったシステムを評価する場合に,プーリング法で作成したNTCIR-2 が有効であるかどうか調べる.本研究では,NTCIR-2 の正解文書リストと,NTCIR ワークショップ2 の参加チームの提出結果を用いて評価実験を行った.まず,最終的な正解文書リストFと,F から追加の対話型検索I だけで見つかった文書を除いた正解文書リストF ? I を用いて,提出結果の評価を行った.次に,各サブタスクごとの提出結果からプーリングを行い,このサブタスクごとのプールを正解文書リストとして用いた場合の評価を行った.さらに,プーリングに参加しなかったシステムの評価をシミュレートするため,F から同じシステムの提出結果の集合だけに含まれている正解文書S を除いた正解文書リストF ? S を用いて,そのシステムの提出結果を評価した.いずれの場合でも,提出結果の平均精度の平均による順位付けを行い,相対的評価とした.結果として,どの文書リストを正解文書リストとして用いて提出結果の評価を行っても,提出結果の相対的な順位はほとんど変化しなかった.また,そのシステムだけが見つけた正解文書を除いても,すなわち,そのシステムがプーリングに参加しなくても,そのシステムの提出結果の評価にはほとんど影響がなく,プーリングに参加した他システムとの相対的評価についても影響がないことが分かった.このことから,プーリング法に基づいて作成したテストコレクションの信頼性を確かめることができた.The purposes of this study are to examine whether there is an effect on the relative evalu- ation of the IR systems using the relevance judgments of the test collection NTCIR-2 made by the pooling method and additional interactive searches,and to investigate whether the NTCIR-2 is effective for evaluating the IR systems,the search results of which were not used for the pooling.We carried out experiments using different lists of relevance judgments and search results submitted for the test of the 2nd NTCIR Workshop. First,we evaluated the search results using the list of the ?nal relevance judgments F of NTCIR-2 and F 竏驤 I that is,the F without the unique relevant documents found by the additional interactive searches I Second,we made pools from the search results for each of the sub-tasks and evaluated the search results using the pools as lists of relevance judgments.Third,we evaluated the search results using F 竏驤 S that is,the F without the unique relevant documents found by an IR system S in order to simulate evaluation of the IR system which was not used for the pooling. Almost the same rankings of the search results were produced by using the pools as lists of relevance judgments for system evaluation.When the search results by an IR system were not used for the pooling,there is a very little effect on evaluation of the system itself and relative evaluation among it and other systems.Therefore our results veri ?ed the reliability of test collection as an evaluation tool,which was based on pooling method. - Categorising deverbal nouns based on lexical conceptual structure for analysing Japanese compounds
K Takeuchi, K Uchiyama, M Yoshioka, K Kageura, T Koyama
2001 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN, AND CYBERNETICS, VOLS 1-5, 904, 909, IEEE, 2002年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), This paper proposes a method to describe conceptual meanings of Japanese deverbal nouns for the purpose of analysing Japanese compound nouns. A lexical meaning of each constituent word is very important since it deeply influences a word formation of compound words. Therefore we intend to use the lexical meanings of constituent words to build a Japanese compound noun analyser. As a first step to describe lexical meanings of words, we have established a simple semantic structure based on lexical conceptual structure (we refer to the structure we establish by TLCS1 in this paper). After the analysing 250 deverbal nouns that appeared in technical terms, we found that the only 14 types of TLCSes cover various deverbal nouns. We will explain in this paper the types of TLCS and also show the procedure of assigning TLCSes to deverbals. In order to evaluate the efficacy of TLCS, we made use of the accuracy of simple compound noun analyser for analysing technical terms. The result was very good, which shows that our proposed method is very promising. - 設計知識管理のためのCADアーキテクチャーの提案
Yutaka Nomaguchi, Masaharu Yoshioka, Tetsuo Tomiyama
人工知能学会誌, 17, 1, 104, 113, 2002年
研究論文(学術雑誌), In this paper, we propose a fundamental idea of a new CAD mechanism to facilitate design knowledge management. This mechanism encourages a designer to externalise his/her knowledge during a design process and facilitates sharing and reuse of such externalised design knowledge in later stages. We also describe the implementation of this idea called DDMS (Design Documentation Management System). DDMS works as a front end to KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the features of DDMS. - Discovery of maximal analogies between stories
M Haraguchi, S Nakano, M Yoshioka
DISCOVERY SCIENCE, PROCEEDINGS, 2534, 324, 331, SPRINGER-VERLAG BERLIN, 2002年
英語, 研究論文(学術雑誌), Given two documents in the form of texts, we present a notion of maximal analogy representing a generalized event sequence of documents with a maximal set of events. They are intended to be used as extended indices of documents to automatically organize a document database from various viewpoints. The maximal analogy is defined so as to satisfy a certain consistency condition and a cost condition. Under the consistency condition, a term in an event sequence is generalized to more abstract term independently of its occurrence positions. The cost condition is introduced so that meaningless similarities between documents are never concluded. As the cost function is monotone, we can present an optimized bottom-up search procedure to discover a maximal analogy under an upper bound of cost. We also show some experimental results based on which we discuss a future plan. - A Knowledge Operation model of Synthesis
TOMIYAMA Tetsuo, YOSHIOKA Masaharu, TSUMAYA Akira
Engineering Design Synthesis - Understanding, Approaches, and Tools, Springer-Verlag, pp.67-90, 2002年01月
英語, 研究論文(学術雑誌) - 設計知識管理のためのCADアーキテクチャーの提案
野間口大, 吉岡真治, 冨山哲男
人工知能学会論文誌, 17, 104, 113, 社団法人 人工知能学会, 2002年, [査読有り]
研究論文(学術雑誌), In this paper, we propose a fundamental idea of a new CAD mechanism to facilitate design knowledge management. This mechanism encourages a designer to externalise his/her knowledge during a design process and facilitates sharing and reuse of such externalised design knowledge in later stages. We also describe the implementation of this idea called DDMS (Design Documentation Management System). DDMS works as a front end to KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the features of DDMS. - Proposal of an Integrated Design Support Environment Based on the Model of Synthesis
YOSHIOKA Masaharu
Proceeding of the 2001 ASME Design Engineering Technical Conference & Computers and Information in Engineering Conference, American Society of Mechanical Engineers, 2001年09月09日, [査読有り], [筆頭著者]
研究論文(国際会議プロシーディングス),Abstract
We propose a new integrated computational environment, called a Knowledge Intensive Engineering Framework (KIEF), to support design object modeling, during engineering design process that requires a variety of design object models, such as a geometric model, a control model, and a finite element model. KIEF is capable of guiding designers with design process knowledge based on a model of synthesis, of integrating multiple design object models, and of maintaining consistency among these models. The design process knowledge is a result of a research project we conduct to establish a model of synthesis. This model formalizes design process knowledge in a design process as operations to a multiple model-based reasoning system, such as KIEF, and from a language of synthesis. We describe a prototype system that incorporates design process knowledge to KIEF and illustrate an example design on it. - 設計対象知識操作論
吉岡 真治, 冨山 哲男
精密工学会誌 = Journal of the Japan Society of Precision Engineering, 67, 9, 1490, 1496, 公益社団法人精密工学会, 2001年09月05日
日本語, In a design process, a designer uses various kinds of design object knowledge, such as physical laws, mechanism library, and manufacturing knowledge. Therefore, it is necessary for a CAD system to handle large scale knowledge bases to support this process. However, it is difficult to use a large scale knowledge base without knowledge about operations of the knowledge itself. This paper proposes a theory of design knowledge operations. First, we analyze the results of design experiments that are records of real design processes. Second, we formalize design knowledge operations based on General Design Theory. Finally we discuss the generality of the proposed formalism of design knowledge operations. - A Model of Synthesis: A System of Multiple Theories
TOMIYAMA Tetsuo, HEW Ken P, MURAKAMI Tamotsu, YOSHIOKA Masaharu, TAKEDA Hideaki, WASHIO Takeshi, TSUMAYA Akira, UMEDA Yasushi
Proceedings of the International CIRP Design Seminar 2001, pp.1-6, 2001年06月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - 大規模学術情報データベースに適した情報検索システムの開発
大山 敬三, 影浦 峡, 神門 典子, 木村 優, 丸山 勝巳, 吉岡 真治, 高橋 一道
電子情報通信学会論文誌. D-1, 情報・システム 1-情報処理, 84, 6, 658, 670, 一般社団法人電子情報通信学会, 2001年06月01日
日本語, インターネットの発展に伴い, WWWを介した本格的な情報検索サービスの堤供が求められているが, 既存のWWW情報検索システムでは, 検索機能やデータベースの構造・規模などに制約が多い.本論文の情報検索システムは実際の情報検索サービスで運用されているものであり, 大規模で複雑な構造をもつテキスト型の学術情報データベースに対し, 高度な検索機能を, ラインモードとWWWインタフェースにより提供している.本論文では, まず情報検索機能の概要と設計について, 特に集合演算, シソーラス検索, 階層構造検索, 複数データベースの統合検索などの特徴的な機能について述べている.次に, その実現のための実装技術として, 検索エンジンの特長, セッション管理方式, 大規模データベースの扱い, サーバ及びプロセスの構成などを示し, 現状のシステムについての運用上の評価を行い, 最後に今後の課題と関連研究について議論している. - 設計シミュレータを用いた設計文書作成支援
野間口大, 冨山哲男, 吉岡真治
2001年度精密工学会春季大会学術講演会講演論文集, 2001年04月
日本語, 研究論文(その他学術会議資料等) - A general framework for modelling of synthesis integration of theories of synthesis
H Takeda, M Yoshioka, T Tomiyama
DESIGN RESEARCH - THEORIES, METHODOLOGIES, AND PRODUCT MODELLING, 307, 314, PROFESSIONAL ENGINEERING PUBLISHING LTD, 2001年
英語, 研究論文(国際会議プロシーディングス) - Design for upgradable products considering future uncertainty
Y Umemori, S Kondoh, Y Umeda, Y Shimomura, M Yoshioka
SECOND INTERNATIONAL SYMPOSIUM ON ENVIRONMENTALLY CONSCIOUS DESIGN AND INVERSE MANUFACTURING, PROCEEDINGS, 87, 92, IEEE COMPUTER SOC, 2001年
英語, 研究論文(国際会議プロシーディングス), Conventional products tend to be thrown away because of functional obsoleteness before reaching the end of physical life of the products, This is one of the main causes of the mass disposal problem. In order to solve this problem, this paper proposes a design methodology for upgradable products, Especially, this paper discusses a method dealing with uncertainty caused by long-term planning in the design methodology for upgradability Namely, the proposed method deals with uncertainty as ranges of parameter values, and derives a design solution that realizes required upgrades, while adapting to estimated uncertainty. This method makes the products robust and tolerant against the uncertainty and, therefore, makes design for upgradability more feasible. - Verification of a model of synthesis - The methods for verification and results
A Tsumaya, Y Nomaguchi, M Yoshioka, H Takeda, T Murakami, T Tomiyama
DESIGN RESEARCH - THEORIES, METHODOLOGIES, AND PRODUCT MODELLING, 229, 236, PROFESSIONAL ENGINEERING PUBLISHING LTD, 2001年
英語, 研究論文(国際会議プロシーディングス) - A Model of Synthesis from the Viewpoint of Design Knowledge Operations
TOMIYAMA Tetsuo, YOSHIOKA Masaharu, TSUMAYA Akira
Proceedings of the 1st International Conference on Mechanocal Engineering (ICME2000), CD-ROM (6 pages), 2000年11月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - IR/IE/Summarisation Evaluation Projects in Japan
Kageura,K, Fukushima, T, Kando, N, Okumura, M, Sekine, S, Kuriyama, K, Takeuchi, K, Yoshioka, M, Koyama, T, Isahara, H
Proceedings of LREC 2000 Workshop on Using Evaluation within HLT Programs, Athens, Greece, May, 2000, 19, 22, 2000年05月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - Recent advances in automatic term recognition: Experiences from the NTCIR workshop on information retrieval and term recognition
Kyo Kageura, Masaharu Yoshioka, Koichi Takeuchi, Teruo Koyama, Keita Tsuji, Fuyuki Yoshikane
Terminology, 6, 2, 151, 173, 2000年, [査読有り]
英語, 研究論文(学術雑誌), This article provides basic background information on the articles included in this special issue on Japanese term extraction, by (i) clarifying the basic background of research into automatic term recognition, (ii) explaining briefl y the ‘contest’-style workshop we organised in 1999, and (iii) briefl y summarising the ATR methodologies proposed in the articles, and positioning their ideas, philosophies and methodologies within ATR from a unifi ed perspective. Through this information, we intend to consolidate the contributions of the NTCIR TMREC workshop, and, hopefully, clarify a basic framework for discussion which different researchers can use to constructively communicate with each other about automatic term extraction and beyond. © 2000 John Benjamins Publishing Co. - 情報検索サービスNACSIS-IRの新たな展開 (情報検索の新潮流)
木村 優, 吉岡 真治, 神門 典子, 影浦 峡, 大山 敬三
情報の科学と技術, 50, 1, 30, 36, 一般社団法人 情報科学技術協会, 2000年
日本語, 学術情報センターの情報検索サービスNACSIS-IRにおける検索システム及び検索インタフェースの移行について述べる。センターでは,1987年から汎用機を利用した情報検索サービスを行ってきたが,平成12年1月からオープンシステムに全面的に移行し,全文検索機能による検索システムを提供する。新しい情報検索システムでのデ一タベースの構造,全文検索に対応する検索機能及びWWWを用いた検索インタフェース等について報告する。 - オントロジーを用いた統合的設計支援環境の実現 (「オントロジーの基礎と応用」)
関谷 貴之, 吉岡 真治, 冨山 哲男, Takayuki Sekiya, Masaharu Yoshioka, Tetsuo Tomiyama
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 14, 6, 1051, 1060, 人工知能学会, 1999年11月01日
日本語, During design, a designer uses various computational tools, such as a geometric modeling system, analysis tools, and databases. To support these design processes, a system that can integrate such computational tools is required. For this purpose, we have been developing the Knowledge Intensive Engineering Framework (KIEF) system. KIEF enables the designer to build, evaluate, and modify design models on the system by providing him/her with a wide variety of engineering knowledge. A common ontology plays an important role in integrating tools and representing engineering knowledge. This paper describes the structure of the ontology in KIEF, and how it is used in a modeling processes on KIEF. - Knowledge Acquisition by Documenting Design for the Knowledge Intensive Engineering Framework
Nomaguchi, Y, Yoshioka, M, Tomiyama, T
Proceedings of the 1999 Lancaster International Workshop on Engineering Design, 135, 163, 1999年05月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - 設計文書からの知識の構造化の手法の提案
野間口大, 吉岡真治, 冨山哲男
日本機械学会第9回設計工学・システム部門講演会論文集, 1999年04月
日本語, 研究論文(その他学術会議資料等) - A proposal of design methodology for upgradable products
Yasushi Umeda, Yoshiki Shimomura, Masaharu Yoshioka, Tetsuo Tomiyama
Proceedings of the ASME Design Engineering Technical Conference, 4, 407, 417, American Society of Mechanical Engineers (ASME), 1999年
英語, 研究論文(国際会議プロシーディングス), One of main causes of the environmental issues is the current mass production paradigm. Developing upgradable products is one of the most hopeful approaches for solving these issues, because they will have longer lives, encourage reuse of artifacts, and therefore, create new business chances at later stage.s of product life cycles. However, design for upgradability has been hardly discussed. Thi.s paper proposes a design methodology for upgradable products. First, we clarify the definition of design for upgradability by comparing it with other design strategies. Second, by analyzing data of existing serie.s design, we propose several design pattem.s and two basic guiding principles
namely, making function independent and making function insensitive. Based on these analyses, a design methodology for upgradability is proposed and a prototype of upgrade design support system i.s illustrated. Finally, feasibility of the methodology i.s discussed by applying result of an experimental design to the prototype system. - Toward a reasoning framework of design as synthesis
Masaharu Yoshioka, Tetsuo Tomiyama
Proceedings of the ASME Design Engineering Technical Conference, 3, 1, 11, American Society of Mechanical Engineers (ASME), 1999年
英語, 研究論文(国際会議プロシーディングス), Most of the previous research efforts for design process modeling had such assumptions as "design as problem solving,""design as decision making,"and "design by analysis,"and did not explicitly address "design as synthesis."These views lack notion and understanding about synthesis. Compared with analysis, synthesis is less understood and clarified. This paper discusses our fundamental view on synthesis and approach toward a reasoning framework of design as synthesis. To do so, we observe the designer's activity and formalize knowledge operations in design processes. From the observation, we propose a hypothetical reasoning framework of design based on multiple model-based reasoning. We discuss the implementation strategy for the framework. - Overview of TMREC Tasks.
Kyo Kageura, Masaharu Yoshioka, Koichi Takeuchi, Teruo Koyama, Keita Tsuji, Fuyuki Yoshikane, Maho Okada
Proceedings of the First NTCIR Workshop on Research in Japanese Text Retrieval and Term Recognition, NTCIR-1, Tokyo, Japan, August 30 - September 1, 1999, National Center for Science Information Systems (NACSIS), 1999年, [査読有り] - Evaluation of the Term Recognition Task.
Kyo Kageura, Masaharu Yoshioka, Keita Tsuji, Fuyuki Yoshikane, Koichi Takeuchi, Teruo Koyama
Proceedings of the First NTCIR Workshop on Research in Japanese Text Retrieval and Term Recognition, NTCIR-1, Tokyo, Japan, August 30 - September 1, 1999, 417, 434, National Center for Science Information Systems (NACSIS), 1999年, [査読有り] - Evaluation of the Role Analysis Task.
Teruo Koyama, Masaharu Yoshioka, Koichi Takeuchi, Kyo Kageura
Proceedings of the First NTCIR Workshop on Research in Japanese Text Retrieval and Term Recognition, NTCIR-1, Tokyo, Japan, August 30 - September 1, 1999, National Center for Science Information Systems (NACSIS), 1999年, [査読有り] - Evaluation of the Keyword Extraction Task.
Koichi Takeuchi, Masaharu Yoshioka, Teruo Koyama, Kyo Kageura
Proceedings of the First NTCIR Workshop on Research in Japanese Text Retrieval and Term Recognition, NTCIR-1, Tokyo, Japan, August 30 - September 1, 1999, National Center for Science Information Systems (NACSIS), 1999年, [査読有り] - 設計知識に注目した設計の推論モデルの提案(第2報) --設計行為に関する知識の提案--
武田英明, 吉岡真治, 冨山哲男
日本機械学会 第9回 設計工学・システム部門講演会, 82, 85, 1999年01月
日本語 - Phrase processing methods for Japanese text retrieval
Kando, N, Kageura, K, Yoshioka, M, Oyama, K
Proceedings of ACM-SIGIR Workshop on Information Retrieval: Theory into Practice. August 28, 1998, Melbourne, Australia, 13, 19, 1998年08月28日, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - 設計支援のための統合モデリング環境の研究 : プラガブル・メタモデル機構の提案
吉岡 真治, 冨山 哲男, Masaharu Yoshioka, Tetsuo Tomiyama
人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 13, 2, 312, 319, 人工知能学会, 1998年03月01日
日本語, In this study, we propose a framework of an integrated modeling environment for design. Since a mechanical engineering design process requires various kinds of design object models, such as a geometric model, a kinematic model, and a finite element model, this environment should maintain consistency among these models. Furthermore, commercial design tools are practically used in design processes, and these must be integrated as well. For dealing with multiple design object models, we have formalized a concept called a metamodel. A metamodel is a model which represents relationships among concepts used in various design object models. This paper proposes a framework of the pluggable metamodel mechanism that allows to plug in existing design tools, to support a modeling on it, and to maintain consistency among them. We describe a prototype system and illustrate an example of ball screw design. - Phrase processing methods for Japanese text retrieval
Noriko Kando, Kyo Kageura, Masaharu Yoshioka, Keizo Oyama
SIGIR Forum (ACM Special Interest Group on Information Retrieval), 32, 2, 23, 28, Association for Computing Machinery (ACM), 1998年, [査読有り]
英語, 研究論文(学術雑誌), This paper examines the effectiveness of different phrase identification and weighting methods for Japanese text retrieval in an operational information retrieval (IR) system, called NACSIS-IR. Based on our previous experiments, we used character-based indexing with positional information and word-or phrase-based query processing, which allowed us to implement sophisticated linguistic analysis on large-scale databases while maintaining adequate efficiency. The results of retrieval experiments on a large-scale Japanese test collection showed that the combination of enhanced phrase identification using patterns defined over part-of-speech tags and our algorithms Phrase2 and Phrase5 made a significant positive contribution to retrieval effectiveness. The paper also discusses indexing and phrase processing of Japanese or East Asian languages. - Representation of design object based on functional evolution process model
Yoshiki Shimomura, Masaharu Yoshioka, Hideaki Takeda, Yasushi Umeda, Tetsuo Tomiyama
Journal of Mechanical Design, 120, 2, 221, 229, 1998年01月, [査読有り]
英語, 研究論文(学術雑誌) - NTCIR : NACSIS Test Collection Project
Noriko Kando, Teruo Koyama, Keizo Oyama, Kyo Kageura, Masaharu Yoshioka
Proceedings of the 20th Annual Colloquium of BCS-IRSG, 1997年01月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - The modeling of synthesis -from the viewpoint of design knowledge
T. Tomiyama, T. Murakami, T. Washio, A. Kubota, H. Takeda, T. Kiriyama, Y. Umeda, M. Yoshioka
WDK 25, Proceedings of the 11th International Conference on Engineering Design in Tampere 199, Tampere, Finland, 1997., 3, 97, 100, 1997年01月, [査読有り]
英語, 研究論文(国際会議プロシーディングス) - 複数の設計対象モデルを扱う設計過程モデル
吉岡真治, 中村雅彦, 冨山哲男, 吉川弘之
日本機械学會論文集. C編, 61, 581, 330, 337, 社団法人日本機械学会, 1995年12月, [査読有り]
研究論文(学術雑誌), An intelligent CAD system aims at serving a designer as an intelligent, integrated design environment. For building such a system, development of a large scale knowledge base is necessary. To do so, design knowledge must be systematically formalized, made computable, and organized. Design knowledge has two categories ; i.e., design object knowledge and design process knowledge. In our previous reports, we have formalized a computable design process model to represent design process knowledge and the concept of a metamodel dealing with multiple design object models. This paper proposes a fra... - Representation of design object based on the functional evolution process model
Yoshiki Shimomura, Hideaki Takeda, Masaharu Yoshioka, Yasushi Umeda, Tetsuo Tomiyama
American Society of Mechanical Engineers, Design Engineering Division (Publication) DE, 83, 2 Pt 1, 351, 360, 1995年, [査読有り]
英語, 研究論文(国際会議プロシーディングス), An extension of the Function-Behavior-State (FBS) diagram is proposed for representing a function in the computer aided conceptual design process. The new FBS method uses three additional concepts, namely: function body, function modifier and object entity, to represent the designers' intention more precisely than the original FBS diagram. The performance of the proposed method is complemented by the Functional Evolution Process (FEP) model which represents the different design processes. - Design process model with multiple design object models
Masaharu Yoshioka, Masahiko Nakamura, Tetsuo Tomiyama, Hiroyuki Yoshikawa
American Society of Mechanical Engineers, Design Engineering Division (Publication) DE, 53, 7, 14, 1993年, [査読有り]
研究論文(国際会議プロシーディングス), An intelligent CAD system is not merely a set of intelligent design tools, but rather it must be an intelligent, integrated design environment. This requests it must be equipped with a large scale knowledge base in which design knowledge is intensively and systematically stored. To do so, design knowledge must be systematically formalized, made computable, and organized. The present paper investigates fundamental issues of systematization of design knowledge. Design knowledge has two categories; i.e., design object knowledge and design process knowledge. In our previous reports, we have formalized a computable design process model to represent design process knowledge and the concept of metamodel dealing with multiple design object models. This paper proposes a framework to achieve harmonized combination of these two. In this framework, the computable design process model navigates the metamodel mechanism to generate and modify models of the design object. We describe a prototype system and illustrate an example of ship design. - 多重世界を用いた設計過程の論理による形式化
武田英明, 吉岡真治, 冨山哲男, 吉川弘之
1991年度人工知能学会(第5回)論文集, 学習院大学、東京, 1991. 1991年6月28日, 1991年06月28日
日本語 - 多重世界を用いた設計過程のシミュレーション
吉岡真治, 河合浩之, 武田英明, 冨山哲男, 吉川弘之
1991年度精密工学会春季大会講演論文集, 早稲田大学、東京, 1991. 1991年3月26日発表, 1991年03月26日
日本語
その他活動・業績
- Preface of Special Issue on 10th Competition on Legal Information of Extraction and Entailment (COLIEE 2023).
Randy Goebel, Yoshinobu Kano, Mi-Young Kim, Juliano Rabelo 0001, Ken Satoh, Masaharu Yoshioka, Rev. Socionetwork Strateg., 18, 1, 25, 26, 2024年04月 - 特定の専門分野を対象とした意味役割付きデータ作成手法~有機合成手順の抽出を例として~
町光二郎, 秋山世治, 長田裕也, 吉岡真治, 吉岡真治, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 30th, 2024年 - 化学反応プロセスの計算結果を解釈するための素反応知識ベースの提案
小嶋陽平, 小野ゆり子, NATH Pinku, 吉岡真治, 吉岡真治, 吉岡真治, 人工知能学会全国大会論文集(Web), 38th, 2024年 - 大規模言語モデルによる自由記述アンケート自動集約のための疑似訓練事例生成
長谷川遼, 銭本友樹, 宇津呂武仁, 西崎博光, 吉岡真治, 神門典子, 人工知能学会全国大会論文集(Web), 38th, 2024年 - 大規模言語モデルと親和性の高い物理法則・原理を考慮した定性推論システムの提案
吉岡 真治, 鈴木 慎平, 人工知能学会全国大会論文集, JSAI2024, 3Xin228, 3Xin228, 2024年
近年の大規模言語モデル(LLM)の発展に伴い、LLMを用いることで、物理的な挙動に対する予測を生成することが可能となっている。しかし、LLMで生成された結果は、かならすしも適切である保証はなく、また、その生成結果の妥当性を説明する枠組みも十分でない。我々は、人間の物理法則・原理などの理解に基づいて、推論を行う枠組みである定性推論を組み合わせることが有用であるという考え方のもとに、LLMと親和性の高い定性推論システムを提案するとともに、具体的な例題を用いてその実行例を示す。, 一般社団法人 人工知能学会, 日本語 - 大規模言語モデルの物理法則・原理の認識結果に基づく定性推論のためのモデル構築手法
鈴木 慎平, 吉岡 真治, 人工知能学会全国大会論文集, JSAI2024, 3Xin227, 3Xin227, 2024年
近年,大規模言語モデル(LLM)が発展し,様々なタスクで高い性能を発揮しているが,対象タスクに類似した事例を基に出力を生成するため,信頼性に劣ることが課題であり,信頼性の高いモデルを構築するには,第一原理をベースとした推論を目指すことが望ましい.本研究では,第一原理の表現方法として,人間の物理法則知識などの理解に基づいた推論を行う枠組である定性推論を活用したモデル構築手法を提案する.本手法は,定性推論のパラメータネットワークとして,LLMが理解している内容をより形式的に表現できるだけでなく,より詳細な現象のシミュレーションなどが可能となることが期待される.一方,定性推論の研究では,特定の事例を表現することを前提とした多くの知識を活用していたため,その汎用性が乏しいと言う問題があった.LLMに関係する物理現象や法則名を発見させることが可能であれば,その情報を活用した定性推論のモデル構築が可能となると考えた.本研究では,高校物理の力学の基本的な問題を対象として,これらの知識の整理方法と定性推論のモデル構築支援を行う方法を提案するとともに,本事例におけるモデル構築の具体例を紹介する., 一般社団法人 人工知能学会, 日本語 - Wikipediaカテゴリと定義文を利用した記事のクラス分類
鈴木 希望, 吉岡 真治, 人工知能学会全国大会論文集, JSAI2024, 4Xin284, 4Xin284, 2024年
Wikipediaには、様々な事物に関するデータが記述されているが、知識工学的な観点からは構造化されていない。多くのWikipediaからの構造化手法では、主に、記事のクラス分類とその属性付与という形での構造化が行われている。Wikipediaカテゴリはこの記事のクラス分類に貢献することが期待されるが、様々な目的でカテゴリが付与されるため、クラス分類に適切なカテゴリのみに絞り込むことは容易ではない。一方、機械学習の方法では、定義文などに注目したクラス推定の手法が提案されているものの、クラスごとにその性能が大きく異なっている。本研究では、人間が付与したデータであるカテゴリと、各記事の主題を定義する定義文を組み合わせたクラス分類の手法を提案する。具体的には、定型的に記述されることの多い定義文から、クラスを代表するような単語・句(定義語)を抽出する方法を提案し、カテゴリと組み合わせることでクラス推定を行う。また、本手法を「森羅プロジェクト」のクラス分類タスクに適用した結果について報告する。, 一般社団法人 人工知能学会, 日本語 - Wikipediaカテゴリオントロジーの分析—新しいカテゴリタイプの提案とそれを用いた分析
戎井 雄祐, 吉岡 真治, 人工知能学会全国大会論文集, JSAI2024, 3Xin229, 3Xin229, 2024年
Wikipediaは最大級のオンライン百科事典であり、DBpedia、YAGO2、日本語Wikipediaオントロジーに代表される構造化された知識を抽出する試みが行われている。我々は、Wikipediaに含まれる情報の中でも、各記事の主題索引付けのために利用されるWikipediaカテゴリに注目したWikipediaカテゴリオントロジーを提案している。本枠組みでは、Wikipediaのカテゴリを、「国」や「大学」のような概念を表すSetカテゴリ、「日本」や「北海道大学」のような具体的な事象を表すTopicカテゴリなどを用いてカテゴリを分類するとともに、カテゴリ間の親子関係を整理した。しかし、実際の各記事におけるカテゴリの役割に注目すると、概念を表すSetカテゴリが付与されている場合でも、Topic的な役割を果たすカテゴリとして利用されている場合なども多く存在することが確認された。本稿では、各記事におけるカテゴリの役割にも注目したカテゴリ分類のための新しい定義と、新しい分類方法を提案する。, 一般社団法人 人工知能学会, 日本語 - Report on the 9th ACM SIGIR / the 13th International Conference on the Theory of Information Retrieval (ICTIR 2023).
Masaharu Yoshioka, Mohammad Aliannejadi, Julia Kiseleva, SIGIR Forum, 57, 2, 10, 5, 2023年12月, [招待有り] - 形式概念分析を利用したユーザの興味を異なる観点から再構成する音楽推薦システム
椿 康平, 吉岡 真治, 大久保 好章, 人工知能学会研究会資料 人工知能基本問題研究会, 124, 07, 12, 2023年03月06日
一般社団法人 人工知能学会, 日本語 - 学生フォーラム(第115回)吉岡真治先生インタビュー「多分野での経験が後につながる」
吉岡 真治, 人工知能 : 人工知能学会誌 : journal of the Japanese Society for Artificial Intelligence, 38, 1, 81, 84, 2023年01月
東京 : 人工知能学会 ; 2014-, 日本語 - 化学反応に関する情報抽出システムを用いた論文データベース分析システム
吉岡 真治, 町 光二郎, 長田 裕也, 人工知能学会全国大会論文集, JSAI2023, 4Xin145, 4Xin145, 2023年
我々は、特定の分野の複数の論文を収録する論文データベースに対して、その分野で重要とされる用語を抽出し、その用語間の共起関係などを分析する論文データベース分析システムを提案し、ナノ結晶デバイス開発に関する研究分野において、そのシステムの有効性を検討してきた。本論文では、従来の分野と類似するが、少し分野の異なる有機反応合成における化学反応を扱う論文を対象としたシステムを構築することにより、提案してきたシステムの汎用性を検討した。その結果、化学反応の分野では、化学反応データベースのようなデータベースが整備されている一方で、その表記の手法が多様であり、データベースを活用した表記の正規化などが望まれることが確認された。, 一般社団法人 人工知能学会, 日本語 - Preface of Special Issue on 8th Competition on Legal Information of Extraction and Entailment (COLIEE 2021).
Randy Goebel, Yoshinobu Kano, Mi-Young Kim, Juliano Rabelo 0001, Ken Satoh, Masaharu Yoshioka, The Review of Socionetwork Strategies, 16, 1, 109, 110, 2022年 - Preface of Special Issue on 8th Competition on Legal Information of Extraction and Entailment (COLIEE 2021).
Randy Goebel, Yoshinobu Kano, Mi-Young Kim, Juliano Rabelo 0001, Ken Satoh, Masaharu Yoshioka, The Review of Socionetwork Strategies, 16, 1, 109, 110, 2022年 - Extended Overview of ChEMU 2022 Evaluation Campaign: Information Extraction in Chemical Patents.
Yuan Li, Biaoyan Fang, Jiayuan He 0002, Hiyori Yoshikawa, Saber A. Akhondi, Christian Druckenbrodt, Camilo Thorne, Zubair Afzal, Zenan Zhai, Kojiro Machi, Masaharu Yoshioka, Youngrok Jang, Hosung Song, Junho Lee, Gyeonghun Kim, Yireun Kim, Stanley Jungkyu Choi, Honglak Lee, Kyunghoon Bae, Darshini Mahendran, Christina Tang, Bridget T. McInnes, Timothy Baldwin, Karin Verspoor, CLEF (Working Notes), 758, 781, 2022年
CEUR-WS.org - Wikipediaカテゴリオントロジー - Wikipediaカテゴリの知識工学的観点からの活用を目指して -
吉岡 真治, 人工知能学会第二種研究会資料, 2021, 55, 5, 5, 2021年Wikipedia is one of the largest knowledge resources available via the Internet. Several methods have been proposed for extracting knowledge/information from Wikipedia, but methods based on extracting knowledge from the Wikipedia category structure can not utilize whole part of its structure because of the complexity of the relationships between the various categories. In this paper, we briefly review our previous researches on analyzing Wikipedia category and introduce a framework called "Wikipedia Category Ontology" (WCO) that aims to act as a basis for interpreting the Wikipedia category structure. It is based on a classification of category types and relationship types and available online in the form of Linked Open Data at http://wcontology.org/. We also demonstrate the system by using Wikipedia category analysis scenarios.
, 一般社団法人 人工知能学会, 日本語 - NTCIR15QA Lab-PoliInfo-2の報告およびデータセット公開
木村泰知, 渋木英潔, 高丸圭一, 内田ゆず, 乙武北斗, 石下円香, 三田村照子, 吉岡真治, 秋葉友良, 小川泰弘, 佐々木稔, 横手健一, 神門典子, 森辰則, 荒木健治, 関根聡, 言語処理学会年次大会発表論文集(Web), 27th, 2021年 - 日本語Wikipediaカテゴリを用いた記事のクラス分類手法の提案
小板橋佳晃, 吉岡真治, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 27th, 2021年 - ZDDを用いた集合分割の列挙索引化手法の提案と実験的評価 (特集 「命題論理の充足可能性問題SATの最新動向」および一般)
高橋 翔哉, 吉岡 真治, 人工知能基本問題研究会, 112, 42, 47, 2020年03月08日
人工知能学会, 日本語 - グラフ上の組合せ最適化問題に対するアルゴリズムへのGraph Neural Networksを用いた枝刈りの導入 (特集 「統計的関係学習」および一般)
中野 裕太, 吉岡 真治, 人工知能基本問題研究会, 111, 23, 28, 2020年01月29日
人工知能学会, 日本語 - NTCIR-15QA Lab-PoliInfo2のタスク設計
木村泰知, 渋木英潔, 高丸圭一, 秋葉友良, 石下円香, 内田ゆず, 小川泰弘, 乙武北斗, 佐々木稔, 三田村照子, 横手健一, 吉岡真治, 神門典子, 神門典子, 言語処理学会年次大会発表論文集(Web), 26th, 2020年 - 森羅と日本版DBpediaにおける属性の取り扱いに関する比較分析
小板橋佳晃, 吉岡真治, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 26th, 2020年 - ユーザの興味を反映したニュースサイトの多観点スタンス分析
立浪紀彦, 吉岡真治, 神門典子, ALLAN James, 伊藤正彦, 言語処理学会年次大会発表論文集(Web), 26th, 2020年 - 無機化合物を対象とした論文に対する化学物質名抽出システムの性能分析
町光二郎, 吉岡真治, 吉岡真治, 吉岡真治, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 26th, 2020年 - 化学物質データベースを訓練データに用いた化学物質名識別システムに関する実験的分析
町光二郎, 吉岡真治, 情報処理学会研究報告(Web), 2020, IFAT-139, 2020年 - Wikipediaカテゴリオントロジーを利用したWikipediaページのクラス分類
中川 嵩教, 小板橋 佳晃, 吉岡 真治, 人工知能学会全国大会論文集, 2020, 0, 4H3GS405, 4H3GS405, 2020年Wikipediaのカテゴリには、その属するページのクラス分類に有用な情報が含まれているため、このカテゴリ情報を用いたクラス分類の方法が提案されている。しかし、Wikipediaカテゴリには、様々なタイプの情報が混在しているため、同時に付与することが適切でないようなカテゴリをつけてしまうといった問題があった。本研究では、Wikipediaカテゴリのタイプやその親子関係についての定義を与えているWikipediaカテゴリオントロジーを用いることにより、複数のカテゴリを有するようなページに対して、より適切なクラスを推定し分類する方法を提案する。この手法を用いることにより、複数のカテゴリに属するページのクラスの適切性を順位づけることができた。また、本手法の有用性を日本語Wikipediaに対して同様の試みを行っている「森羅」の分類と比較し、その有効性を確認した。
, 一般社団法人 人工知能学会, 日本語 - 東京都議会会議録における議案への賛否を表明する発言の分析:NTCIR-15 QA Lab-PoliInfo-2 Stance Classification Taskに向けて
高丸 圭一, 木村 泰知, 内田 ゆず, 佐々木 稔, 吉岡 真治, 秋葉 友良, 渋木 英潔, 人工知能学会全国大会論文集, 2020, 0, 4Q3GS901, 4Q3GS901, 2020年筆者らは評価型タスクNTCIR-15 QA Lab-PoliInfo-2において東京都議会会議録を対象として、議会における議員の発言から、議員が所属する会派の各議案への賛否を推定するStance Classification Taskを企画している。 例えば会議録「受動喫煙防止は、我が都議会自民党の公約であり、私自身も、ぜひ積極的に進めていただきたいと心から願う一人です。しかしながら、そのことと、今回提出された条例案がよいものかというのは別の話であり、残念ながら、この条例には問題が多く、賛成できないというのが、我が党の考えです。」という発言から「都議会自民党」は提出された議案へ「反対」を表明していることが分かる。本稿では、Stance Classification Taskの正解データの構築に向けて、議案への賛否を表明する発言の分析結果について述べる。
, 一般社団法人 人工知能学会, 日本語 - 建築分野における社内技術文書検索システム作成のための予備的調査
古川 慧, 吉岡 真治, 人工知能学会全国大会論文集, 2020, 0, 3Rin470, 3Rin470, 2020年近年、様々な業種の企業において、技術の標準化や技術継承を目的として、多くの社内技術文書が作成され蓄積されている。これらの社内技術文書には、一定のフォーマットが与えられ、文書検索システムによって検索可能な形で共有されることが多い。しかし、これらの文書では、特定の分野に特化して記述された文書が多く、あらかじめ関係しそうな文書を知っている経験のある技術者にとっては、関連する文書を見つけるのに十分なシステムであるが、経験の浅い技術者にとっては、どのような文書が存在するのかが不明なだけでなく、適切な検索語を見つけないと関係する文書があってもうまく見つけられないといった問題点がある。 本研究では、著者の一人が所属する建設会社における社内文書群を例として、上記問題点に関する予備調査を行うと共に、建築施工段階や建築条件を考慮した技術文書の検索支援システムについての基本構想を紹介する。
, 一般社団法人 人工知能学会, 日本語 - 複数のテクニカル指標を用いた市場動向の予測
片寄 諒亮, 吉岡 真治, 人工知能学会全国大会論文集, 2020, 0, 3Rin412, 3Rin412, 2020年近年、時系列データや金融指標を用いたテクニカル分析やファンダメンタル分析、さらにニュース情報を用いたテキスト分析など様々な形で株価の予測が行われている。我々は、テクニカル分析などを用いたアルゴリズム取引が増えていることを考慮し、複数のテクニカル指標を用いた機械学習による株価予測の手法を提案する。この際に、企業の決算発表やニュースリリースなどテクニカル分析以外の要因の影響を考慮し、テクニカル分析による当てはまりが良い銘柄、悪い銘柄などを分類した上で作成した学習・評価データを作成して評価を行うと共に、複数のテクニカル指標の組み合わせ方法について検討を行う。
, 一般社団法人 人工知能学会, 日本語 - 専門用語の知識保全エコシステムを有するインハウス論文・図表データベースの構築
吉岡真治, 尹磊, 原真二郎, 鈴木晃, 高山英紀, 石井真史, 言語処理学会年次大会発表論文集(Web), 25th, 2019年 - 法律文書処理の国際コンテスト型ワークショップCOLIEE2018の開催
狩野芳伸, 吉岡真治, KIM Mi-Young, LU Yao, RABELO Juliano, 清田直希, GOEBEL Randy, 佐藤健, 言語処理学会年次大会発表論文集(Web), 25th, 2019年 - Wikipediaカテゴリの構成要素に注目したカテゴリ階層の分析
中川嵩教, 小板橋佳晃, 吉岡真治, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 25th, 2019年 - 更新可能な用語抽出機能を持つ小規模研究グループ向け論文・図表データベースの構築
吉岡真治, 吉岡真治, 大久保好章, 尹磊, 原真二郎, 鈴木晃, 高山英紀, 石井真史, 応用物理学会秋季学術講演会講演予稿集(CD-ROM), 80th, 2019年 - 知識工学者のためのWikipediaカテゴリの分析とその活用
吉岡真治, 吉岡真治, 人工知能学会人工知能基本問題研究会資料, 110th, 2019年 - カテゴリの親子関係の種類に基づくWikipediaカテゴリの再整理
中川 嵩教, 小板橋 佳晃, 吉岡 真治, 人工知能学会全国大会論文集, 2019, 0, 1K2J405, 1K2J405, 2019年Wikipediaカテゴリを分析する研究から、カテゴリには概念分類を表すものだけでなく、人名や組織名といったインスタンスを表すものやその組み合わせが存在しているために、知識工学的観点から利用するためには、そのカテゴリ間の関係について検討することが必要であることが提案された。また、この考え方に基づき、カテゴリの種類、カテゴリの親子関係の種類を整理したデータの構築を行った。本稿では、この構築したデータに基づき、特定の親子関係のみを利用して(あるいは、排除して)できあがるカテゴリ階層構造の性質を議論することで、これまでに提案してきたWikipediaカテゴリに関する分類の枠組の有用性について議論する。
, 一般社団法人 人工知能学会, 日本語 - 大規模ニュース記事データベースを用いた複数観点からの記事の対比と報道スタンスの分析
立浪紀彦, 吉岡真治, 情報処理学会研究報告(Web), 2018, ICS-192, Vol.2018‐ICS‐192,No.6,1‐4 (WEB ONLY), 2018年06月29日
日本語 - 知識工学者のためのWikipediaカテゴリ構造の再整理の構想
吉岡真治, 中川嵩教, 言語処理学会年次大会発表論文集(Web), 24th, ROMBUNNO.P12‐1 (WEB ONLY), 2018年
日本語 - 知識工学者のための日本語Wikipediaのカテゴリ階層構造の再整理
中川 嵩教, 吉岡 真治, 人工知能学会全国大会論文集, 2018, 0, 2F402, 2F402, 2018年Wikipediaは世界最大のインターネット百科事典であり、様々な形で知識源として活用する方法が検討されている。具体的には、各記事に関する属性情報(所在地、生年月日、所属…)などを記述したインフォボックスから属性情報を抽出するDBpediaの研究や、カテゴリの情報を用いて、様々な単語間の類似性を計算する方法や、オントロジーの構築に役立てるYAGO2や、日本語Wikipediaオントロジーの研究などが存在する。また、我々は、これまでに、このカテゴリの性質に関する分析を行っており、これらの研究の中で、Wikipediaのカテゴリの持つ特殊性を指摘し、その特殊性を考慮した利用方法が必要であることを提案してきた。 本研究では、これまでの研究踏まえて、Wikipediaのカテゴリ階層を概念階層として扱う場合の問題点を、具体例を示しながら指摘するとともに、その問題点を解消するための、知識工学的観点からのWikipediaカテゴリの再整理を行う方法を提案する。
, 一般社団法人 人工知能学会, 日本語 - 多観点分析に基づくトピック推定と特許マップへの応用
小野寺大輝, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 23rd, ROMBUNNO.C3‐4 (WEB ONLY), 2017年
日本語 - 人工知能の製造物責任とリスクに関する試論
吉岡 真治, 人工知能学会全国大会論文集, 2017, 0, 1E1OS24a3, 1E1OS24a3, 2017年本試論では、自動運転の車のようなオープンな環境で利用される人工知能を搭載された人工物の製造物責任について検討する。オープンな環境における責任を議論するためには、様々な事態と付随するリスクを認識し、製造者と利用者が適切に分担する枠組が必要になると考えている。本論では、トロッコ問題を例にとり、製造者と利用者がリスクを適切に認識するための枠組とその実現のための人工知能の果たすべき役割について考察する。
, 一般社団法人 人工知能学会, 日本語 - NaDev: An Annotated Corpus to Support Information Extraction from Research Papers on Nanocrystal Devices
Thaer M. Dieb, Masaharu Yoshioka, Shinjiro Hara, 情報処理学会論文誌, 57, 4, 2016年04月15日
The process of nanocrystal device development is not well systematized. To support this process, analysis of the information produced by developmental experiments is required. In this study, we constructed an annotated corpus to support the extraction of experimental information from relevant publications. We designed the corpus-construction guidelines by cooperating with a domain expert. We evaluated these guidelines through corpus-construction experiments with graduate students from this domain, and then evaluated the corpus with the domain expert. In the corpus construction experiments, we achieved a sufficient level of Inter-Annotator Agreement by using a loose agreement measure that ignored the term-boundary mismatch problem, and made an agreement corpus that excluded annotations based on misunderstanding the guidelines. The domain expert evaluated this agreement corpus and modified the guidelines based on real examples. Using these guidelines, we finalized the corpus called "NaDev" (Nanocrystal Device development corpus). The NaDev corpus and its construction guidelines will be released via our website, http://nanoinfo.ist.hokudai.ac.jp/. The NaDev corpus aims to support automatic information extraction from publications relevant to nanocrystal device development. This information can be used to solve problems in the nanotechnology domain using the massive availability of fresh information. To the best of our knowledge, this is the first corpus constructed for the development of nanocrystal devices.\n------------------------------This is a preprint of an article intended for publication Journal ofInformation Processing(JIP). This preprint should not be cited. Thisarticle should be cited as: Journal of Information Processing Vol.24(2016) No.3 (online)------------------------------The process of nanocrystal device development is not well systematized. To support this process, analysis of the information produced by developmental experiments is required. In this study, we constructed an annotated corpus to support the extraction of experimental information from relevant publications. We designed the corpus-construction guidelines by cooperating with a domain expert. We evaluated these guidelines through corpus-construction experiments with graduate students from this domain, and then evaluated the corpus with the domain expert. In the corpus construction experiments, we achieved a sufficient level of Inter-Annotator Agreement by using a loose agreement measure that ignored the term-boundary mismatch problem, and made an agreement corpus that excluded annotations based on misunderstanding the guidelines. The domain expert evaluated this agreement corpus and modified the guidelines based on real examples. Using these guidelines, we finalized the corpus called "NaDev" (Nanocrystal Device development corpus). The NaDev corpus and its construction guidelines will be released via our website, http://nanoinfo.ist.hokudai.ac.jp/. The NaDev corpus aims to support automatic information extraction from publications relevant to nanocrystal device development. This information can be used to solve problems in the nanotechnology domain using the massive availability of fresh information. To the best of our knowledge, this is the first corpus constructed for the development of nanocrystal devices.\n------------------------------This is a preprint of an article intended for publication Journal ofInformation Processing(JIP). This preprint should not be cited. Thisarticle should be cited as: Journal of Information Processing Vol.24(2016) No.3 (online)------------------------------, 英語 - 対象‐観点を考慮したfacet‐biasedトピックモデルと特許マップへの応用
小野寺大輝, 吉岡真治, 言語処理学会年次大会発表論文集(Web), 22nd, P13‐5 (WEB ONLY), 2016年
日本語 - facet-biasedトピックモデルと距離尺度学習を用いたニュース記事の分類
小野寺 大輝, 黄 楽, 吉岡 真治, 人工知能学会全国大会論文集, 2016, 0, 4B45, 4B45, 2016年
一般社団法人 人工知能学会, 日本語 - ナノ知識探索プロジェクト:実験記録からの知識発見(第4報)―キャプションからのメタデータの自動抽出によるグラフイメージ検索システム―
ZHU Tao, DIEB Thaer M, 吉岡真治, 原真二郎, 人工知能学会全国大会論文集(CD-ROM), 30th, ROMBUNNO.1J2‐4, 2016年
日本語 - ナノ知識探索プロジェクト:実験記録からの知識発見(第4報)
朱 濤, Dieb Thaer Mostafa, 吉岡 真治, 原 真二郎, 人工知能学会全国大会論文集, 2016, 0, 1J24, 1J24, 2016年
一般社団法人 人工知能学会, 日本語 - DBPediaの情報に基づくWikipediaのカテゴリ情報の一貫性の分析
吉岡 真治, Loban Rhett, 人工知能学会全国大会論文集, 2015, 0, 1G42, 1G42, 2015年Web上の百科事典であるWikipediaは、様々な事象に関する知識源であるが、その情報の品質については、編集者に依存する。本研究では、DBPediaにより抽出された構造化情報を用いて、Wikipediaのカテゴリ構造の一貫性を分析する方法を提案するとともに、その分析事例について紹介する。
, 一般社団法人 人工知能学会, 日本語 - 複数国の新聞からの多観点比較による分析 ~ GDELT データを用いた分析~ (人工知能学会 研究会優秀賞 受賞)
吉岡 真治, 神門 典子, 人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会 第8回研究会研究発表予稿集, SIG-AM-08-0, 24, 31, 2014年11月
日本語 - 特長表現に注目した対象-観点型特許マップの自動生成
岸桂太, 吉岡真治, 研究報告情報基礎とアクセス技術(IFAT), 2014, 9, 1, 5, 2014年03月22日
多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現から対象と観点を抽出し、それらを用いた特許マップの生成手法を提案する。, 日本語 - Wikipediaのカテゴリー階層関係の分類を用いた日本語Wikipediaオントロジーの分析
吉岡 真治, 人工知能学会全国大会論文集, 2014, 0, 2J34, 2J34, 2014年Wikipediaのカテゴリーは、閲覧者にとって有用な分類を提供するものであり、そのカテゴリーは束状の階層関係として表現される。 この関係には、概念間の階層関係を含む様々な関係が存在する。 本発表では、このカテゴリー階層関係の特徴的なパターンを分析すると共に、その分析結果に基づいた日本語Wikipediaオントロジーに関する考察を行う。
, 一般社団法人 人工知能学会, 日本語 - 特長表現に注目した特許マップの自動生成 (データ工学)
岸 桂太, 吉岡 真治, 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報, 113, 150, 55, 58, 2013年07月22日
多くの特許では、既存の製品の機能向上や好ましくない点の抑制といった効果を目指している。これらの効果に関する記述は、定型的に表現されることが多く、これを特長表現と呼ぶ。本研究では、特長表現を網羅的に集めるための手法を提案するとともに、効果とその対象に注目した特許マップの生成手法を提案する。, 一般社団法人電子情報通信学会, 日本語 - ナノ知識探索プロジェクト:実験記録からの知識発見 (第3報) – Nanodevice Research Papers Clustering Based on Automatic Paper Annotation –
Thaer Moustafa Dieb, 吉岡 真治, 原 真二郎, 2013年度(第27回)人工知能学会全国大会 (JSAI 2013), 富山, 2013年6月4日-7日, 発表論文集, 1C3-4 (4pp.), 1C3-4-1, 1C3-4-4, 2013年06月
英語 - 検索エンジン API を用いたウェブページ収集におけるトピックの多様性
小池 大地, 牧田 健作, 宇津呂 武仁, 河田 容英, 吉岡 真治, 神門 典子, 第5回データ工学と情報マネジメントに関するフォーラム---DEIM フォーラム--- 論文集, 2013年03月
日本語 - ニュース・ツイッター間の対応を考慮したバースト・トピックの同定
高橋 佑介, 胡 碩, 宇津呂 武仁, 吉岡 真治, 神門 典子, 第5回データ工学と情報マネジメントに関するフォーラム---DEIM フォーラム--- 論文集, 2013年03月
日本語 - 日中時系列ニュースにおけるバースト・トピックの推定と二言語間対応付け
HU Shuo, 高橋佑介, ZHENG LiYi, 宇津呂武仁, 吉岡真治, 神門典子, 言語処理学会年次大会発表論文集(Web), 19th, WEB ONLY C3-1, 2013年
日本語 - 時系列中国語ニュース・ブログにおけるトピックモデルの推定と比較対照分析
ZHENG Liyi, HU Shuo, 小池大地, 宇津呂武仁, 吉岡真治, 神門典子, 言語処理学会年次大会発表論文集(Web), 19th, WEB ONLY C3-3, 2013年
日本語 - 検索エンジンAPIを用いて収集したウェブページにおけるトピック多様性の分析
小池 大地, 宇津呂 武仁, 河田 容英, 吉岡 真治, 人工知能学会全国大会論文集, 2013, 0, 2E14in, 2E14in, 2013年本論文では,検索エンジンAPIを用いたウェブページ収集タスクにおいて,ト ピックモデルを用いたトピックの分布の観点から,できる限り多様なウェブペー ジを収集する方式を提案する.提案方式によって,ニュース・ブログにおける トピックとの関連が強いウェブページを収集することにより,より多様性に富 んだトピックの分布が観測できることを示す.
, 一般社団法人 人工知能学会, 日本語 - ナノ知識探索プロジェクト:実験記録からの知識発見(第3報)
Thaer Mostafa Dieb, 吉岡 真治, 原 真二郎, 人工知能学会全国大会論文集, 2013, 0, 1C34, 1C34, 2013年We have been working on the project "Exploring knowledge for nanodevice development" and proposed a framework to annotate useful information (e.g., source material, evaluation parameter, and so on) for analyzing nanocrystal device development papers. In this paper, we conduct nanocrystal device research papers clustering experiment once on annotated papers using automatic annotation results, and once as non-annotated using bag of word approach, and then we compare the results discussing the usefulness of the automatic annotation.
, 一般社団法人 人工知能学会, 日本語 - ナノ知識探索プロジェクト―ナノデバイス開発記録からの知識発見―
吉岡真治, THAER Moustafa Dieb, 原真二郎, Designシンポジウム講演論文集, 2012, 87, 91, 2012年10月16日
日本語 - ナノ知識探索プロジェクト:ナノデバイス開発記録からの知識発見
吉岡 真治, Thaer Moustafa Dieb, 原 真二郎, Designシンポジウム2012, 京都, 2012年10月16日-17日, 発表論文集 (5pp.), 1, 5, 2012年10月
日本語 - Wikipediaカテゴリを用いたWikipediaとGeoNames間のリンク発見とメンテナンス
吉岡 真治, 劉 亦奇, 神門 典子, 情報処理学会論文誌データベース(TOD), 5, 3, 141, 148, 2012年09月28日
近年,地理情報を扱う情報システムの増加にともない,地理情報に関するデータベースへのニーズが高まっている. GeoNames は, Open Data としては,最大規模の地理情報データベースである.本データベースを Linked Open Data として Wikipedia の情報を媒介として関連づけることにより, Web Ontology の開発などに役立てられている.ただし, GeoNames と Wikipedia の間のリンクについては,自動的なリンク発見の試みがいくつか行われているものの,十分な数のリンクが付与されている状態ではない.本論文では, Wikipedia のカテゴリ情報を使うことで,精度良く Wikipedia のページに対応する GeoNames のエントリを発見する方法を提案する.また,本手法は,既存のリンク中の不適切なリンクを発見する際にも利用可能であることを示す.本手法の成果については,すでに, GeoNames の管理者に報告しており,その成果の一部は, GeoNames 中のリンク情報として公開・修正が行われている.Recently, due to the higher demand for geographic information system, it is necessary to have a good geographical database for such systems. GeoNames is one of the largest geographical database as Open Data. This database is also used for constructing web ontology by adding links to the Wikipedia page as a part of Linked Open Data. Even though, here are several attempts to find links automatically, the number of links between GeoNames and Wikipedia is not sufficient. In this paper, we propose an automatic link discovery method to use Wikipedia categories to identify the correspondence between Wikipedia page and GeoNames entry. We also propose to use this method for inappropriate link detection. Link data obtained in this paper is already sent to the manager of GeoNames and a part of the result is used for updating the site., 情報処理学会, 日本語 - 日中時系列ニュース・ブログにおけるトピックモデルの推定と分析
胡 碩, 鄭 立儀, 高橋 佑介, 小池 大地, 牧田 健作, 宇津呂 武仁, 吉岡 真治, 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション, 112, 196, 25, 30, 2012年08月23日
本研究では,日本語および中国語の時系列ニュースおよびブログを対象として,教師なしの(時系列)トピックモデルを適用し,時系列のトピックの推移を推定することにより,二言語間あるいはニュース・ブログの間でのトピックの対応の有無,および,関心事項の差異を分析するアプローチをとる.特に,本論文では,日中時系列ニュースの間でトピック対応を同定する方式についてその詳細および評価結果を述べる.また,中国語において,多様なニュースサイトにおいてバーストするトピックを中心として,中国語ブログの収集を行い,中国語におけるニュースとブログの間での関心事項の違いや意見の有無について分析する., 一般社団法人電子情報通信学会, 日本語 - Wikipediaを中心としたLinked Open Dataに関する一考察
吉岡真治, 研究報告情報基礎とアクセス技術(IFAT), 2012, 1, 1, 5, 2012年07月25日
現在、Wikipedia の情報を中心に様々な Open Data を関連づけて活用する Linked Open Data の研究が行われている。本発表では、Wikipedia のページが表現する情報の粒度が与える影響について考察を行う。, 一般社団法人情報処理学会, 日本語 - NTCIR-9総括と今後の展望
酒井 哲也, 上保 秀夫, 神門 典子, 加藤 恒昭, 相澤 彰子, 秋葉 友良, 後藤 功雄, 木村 文則, 三田村 照子, 西崎 博光, 嶋 秀樹, 吉岡 真治, Shlomo Geva, Ling-XiangTang, Andrew Trotman, Yue Xu, 研究報告情報基礎とアクセス技術(IFAT), 2012, 5, 1, 15, 2012年03月19日
NTCIR (エンティサイル) は国立情報学研究所 (NII) が主催する情報アクセス技術の評価型ワークショップシリーズで,1999 年以来一年半サイクルで開催されている.第 9 回ワークショップ (NTCIR-9) が 2011 年 12 月に終わり,第 10 回 (NTCIR-10) の採択タスクが今年 1 月にアナウンスされたところである.本稿では,NTCIR-9 の簡単な総括を行うとともに,NTCIR-10 の新たな取り組みについて紹介する.NTCIR is a sesquiannual evaluation workshop series on information access which started in 1999 and is run by National Institute of Informatics (NII). The ninth workshop (NTCIR-9) was concluded in December 2011 and the accepted tasks for the tenth workshop (NTCIR-10) have been announced in January 2012. This paper provides a brief summary of NTCIR-9, and introduces some latest developments from NTCIR-10., 一般社団法人情報処理学会, 日本語 - Construction of Tagged Corpus for Nanodevices Development Papers (2ed report): Information Extraction by Cascading Named Entity Recognition Tools
DIEB Thaer M, YOSHIOKA Masaharu, HARA Shinjiro, 言語処理学会年次大会発表論文集, 18th (CD-ROM), ROMBUNNO.B5-2, 2012年03月13日
英語 - 日中時系列ニュースにおけるトピックの推定と二言語間対応付け
HU Shuo, 高橋佑介, 牧田健作, 横本大輔, 宇津呂武仁, 吉岡真治, 言語処理学会年次大会発表論文集, 18th (CD-ROM), ROMBUNNO.F1-5, 2012年03月13日
日本語 - 複数ドメインの意見分析コーパスを用いたアンサンブル学習による意見分析システムの提案
高村慎太郎, 吉岡真治, 関洋平, 言語処理学会年次大会発表論文集, 18th (CD-ROM), ROMBUNNO.P1-11, 2012年03月13日
日本語 - 時系列ニュースにおけるトピックのバーストの同定
高橋佑介, 横本大輔, 宇津呂武仁, 吉岡真治, 言語処理学会年次大会発表論文集, 18th (CD-ROM), ROMBUNNO.F1-4, 2012年03月13日
日本語 - 震災を題材としたニュース・ブログ間の話題の相関と遷移の分析
小池大地, 横本大輔, 牧田健作, 鈴木浩子, 宇津呂武仁, 河田容英, 吉岡真治, 福原知宏, 言語処理学会年次大会発表論文集, 18th (CD-ROM), ROMBUNNO.A5-1, 2012年03月13日
日本語 - 時系列トピックモデルにおけるバーストの同定
高橋 佑介, 横本 大輔, 宇津呂 武仁, 吉岡 真治, 河田 容英, 神門 典子, 福原 知宏, 中川 裕志, 清田 陽司, 第4回データ工学と情報マネージメントに関するフォーラム(DEIM 2012)論文集, F5-5, 2012年03月
日本語, 研究発表ペーパー・要旨(全国大会,その他学術会議) - ブロガーの話題分布の俯瞰と分析
牧田 健作, 横本 大輔, 鈴木 浩子, 宇津呂 武仁, 河田 容英, 神門 典子, 福原 知宏, 中川 裕志, 吉岡 真治, 清田 陽司, 第4回データ工学と情報マネージメントに関するフォーラム(DEIM 2012)論文集, F7-4, 2012年03月
日本語, 研究発表ペーパー・要旨(全国大会,その他学術会議) - ニュース・ブログにおける話題の相関と変遷の分析--- 震災に関する話題を例題として ---
小池 大地, 横本 大輔, 牧田 健作, 鈴木 浩子, 宇津呂 武仁, 河田 容英, 吉岡真治, 神門典子, 福原 知宏, 中川, 清田 陽司, 関 洋平, 第4回データ工学と情報マネージメントに関するフォーラム(DEIM 2012)論文集, F1-4, 2012年03月
日本語, 研究発表ペーパー・要旨(全国大会,その他学術会議) - Wikipediaの階層関係を分析するためのカテゴリパターンの提案 (人工知能学会全国大会(第26回)文化,科学技術と未来) -- (近未来チャレンジセッション「NFC-2 (サバイバル)Wikipediaマイニング」)
藤原 嵩大, 吉岡 真治, 人工知能学会全国大会論文集, 26, 1, 4, 2012年
人工知能学会, 日本語 - 時系列ニュース・ブログにおける話題同定に関する分析 --- 震災を例題として ---
小池 大地, 牧田 健作, 宇津呂 武仁, 河田 容英, 吉岡 真治, 福原 知宏, 人工知能学会全国大会論文集, 2012, 0, 3E1R69, 3E1R69, 2012年本論文では,震災に関する話題についての時系列のニュース記事集合,および, ブログ記事集合を対象として,トピックモデルを用いたトピック同定を行い, ニュース・ブログの間での話題の相関を分析する.本論文では,特に,各トピッ クと密接に対応するニュース記事集合・ブログ記事集合における話題がどの程度 まとまっているか,という点と,時系列バーストの有無との相関について分析を 行った結果を報告する.
, 一般社団法人 人工知能学会, 日本語 - 複数国の新聞サイトを比較分析するNSContrastの実験的分析
吉岡 真治, 神門 典子, 関 洋平, 研究報告 情報基礎とアクセス技術(IFAT), 2011, 2, 1, 8, 2011年07月26日
本研究では、日中韓を中心とした複数国の新聞を比較分析する NSContrast を提案している。本システムでは、実際に毎日の新聞を新聞社のサイトから収集し、その日に注目を浴びている単語のリストや、そのような単語を含む記事数の増減や関連語などを表示することにより、従来のニュースポータルとは異なった観点からの新聞記事分析を可能にするものである。本稿では、本システムの有効性を検証するために行ったユーザ実験とその分析結果について報告する。We have already proposed a system News Site Contrast(NSContrast) that analyzing the characteristic difference between each news site and all others. The system make news article database by retrieving articles from multiple news sites in daily basis. In addition, the system have functions to analyze these articles by showing the hot keywords, related keywords for the retrieved documents. In this paper, we report the result of user experiment and analysis of the results., 日本語 - Construction of Tagged Corpus for Nanodevices Development Papers
DIEB Thaer M, YOSHIOKA Masaharu, 言語処理学会年次大会発表論文集, 17th (CD-ROM), ROMBUNNO.P1-29, 2011年03月
英語 - 特定トピックに関するブログ記事集合の観点分類におけるWikipediaの利用
横本 大輔, 林 東權, 牧田 健作, 宇津呂 武仁, 河田 容英, 福原 知宏, 神門 典子, 吉岡 真治, 中川 裕志, 清田 陽司, 第3回データ工学と情報マネジメントに関するフォーラム, 2011年02月
日本語, 記事・総説・解説・論説等(学術雑誌) - Utilizing Wikipedia as a Knowledge Source in Categorizing Topic Related Blogs into Factes
Daisuke Yokomoto, Dangkwon Lim, Kensaku Makita, Takehito Utsuro, Yasuhide Kawada, Tomohiro Fukuhara, Noriko Kando, Masaharu Yoshioka, Hiroshi Nakagawa, Yoji Kiyota, Proceedings of DEIM Forum 2011, 2011年02月
日本語, 記事・総説・解説・論説等(学術雑誌) - 変化検出のための極大整合連結集合
原口誠, 大久保好章, 富田悦次, 吉岡真治, 人工知能学会人工知能基本問題研究会資料, 84th, 2011年 - Wikipediaを用いた地名の包含関係情報の抽出
竹中 均, 吉岡 真治, 人工知能学会全国大会論文集, 2011, 0, 2J3NFC22, 2J3NFC22, 2011年東京の記述に日本という説明を加えないように、地名を含む情報を記載する場合に、その包含関係の情報を明示的に記述しないことが多い。しかし、これらの地名に関連した情報を検索する場合には、このような暗黙に仮定している関係の情報を利用する必要がある。本研究では、Wikipediaを対象にして、このような検索に有用な地名の包含関係情報の抽出方法を提案する。
, 一般社団法人 人工知能学会, 日本語 - ナノ知識探索プロジェクト : 実験記録からの知識発見(第2報)関連メタデータの追加とその活用
吉岡 真治, Thaer Dieb, 冨岡 克広, 人工知能学会全国大会論文集, 25, 1, 4, 2011年
人工知能学会, 日本語 - ニュースにおけるトピックのバースト特性の分析
高橋佑介, 横本 大輔, 宇津呂 武仁, 吉岡 真治, 情報処理学会研究報告.自然言語処理研究会報告, 6, 6, 1, 6, 2011年
本論文では,時系列ニュースを対象として,情報集約を行うための二種類の方式として,バースト解析およびトピックモデルの2つの手法の考え方を組み合わせることにより,トピックのバーストを検出する方式を提案する.時系列ニュースにおけるバーストとは,世の中における特異な出来事に対応して,ある時期からその出来事に関連するニュース記事が急激に増加する現象を指す.バーストを検出するための代表的な手法として,Kleinbergのバースト解析が挙げられる.この手法においては,一般的に,バーストの検出はキーワード単位で行われる.一方,文書集合におけるトピックの分布を推定するものとしてLDA (latent Dirichlet allocation) やDTM (dynamic topic model) に代表されるトピックモデルがある.トピックモデルを適用することにより,ニュース記事集合全体の情報を,いくつかのトピックに集約することができる.以上の既存技術をふまえて,本論文では,DTMを用いて推定したトピックに対してバースト度を付与することで,トピック単位のバーストが検出可能であることを示す.Among various types of recent information explosion, that in news stream is also a kind of serious problems. This paper studies issues regarding two types of modeling of information flow in news stream, namely, burst analysis and topic modeling. First, when one wants to detect a kind of topics that are paid much more attention than usual, it is usually necessary for him/her to carefully watch every article in news stream at every moment. In such a situation, it is well known in the field of time series analysis that Kleinberg's modeling of bursts is quite effective in detecting burst of keywords. Second, topic models such as LDA (latent Dirichlet allocation) and DTM (dynamic topic model) are also quite effective in estimating distribution of topics over a document collection such as articles in news stream. This paper focuses on the fact that Kleinberg's modeling of bursts is usually applied only to bursts of keywords but not to those of topics. Then, based on Kleinberg's modeling of bursts of keywords, we propose how to measure bursts of topics estimated by a topic model such as LDA and DTM., 一般社団法人情報処理学会, 日本語 - 距離尺度学習を用いた多次元尺度構成法(MDS)による可視化結果のインタラクティブな操作方法の提案
吉岡真治, 伊藤正彦, SEBAG Michele, FEKETE Jean‐Daniel, 情報処理学会研究報告(CD-ROM), 2009, 6, ROMBUNNO.FI-98,8, 2010年04月15日
日本語 - 距離尺度学習を用いた多次元尺度構成法(MDS)による可視化結果のインタラクティブな操作方法の提案
吉岡 真治, 伊藤 正彦, Sebag Michele, Jean-DanielFekete, 情報処理学会研究報告. 情報学基礎研究会報告, 98, 8, H1, H6, 2010年03月04日
多次元尺度構成法(MDS)は、高次元のデータを2次元で表現する手法である。しかし、ユーザが初期の出力結果に満足できない場合が存在する。この問題に対し、本発表では、ユーザにとって分類に役立つ次元を学習する距離尺度学習の手法を応用することによって、MDSの結果をインタラクティブに操作する方法を提案する。また、このシステムを論文の類似度を元にして作成した複数研究者の関係を可視化するシステムに適用した結果について紹介する。Multi Dimensional Scaling (MDS) is one of the popular method for visualizing multidimensional data into 2D world. However, the user may not satisfy the visualization results. In this paper, we propose a novel interactive method for modifying MDS visualization results by using the concept of distance metric learning. We also demonstrate our researcher visualization system based on this algorithm., 情報処理学会, 日本語 - Wikipedia を用いた中日カタカナ翻訳辞書の作成と言語グリッドへの応用
吉岡 真治, 電子情報通信学会技術研究報告. AI, 人工知能と知識処理, 109, 424, 43, 46, 2010年02月15日
辞書を利用する機械翻訳システムにおいて、未登録語が多く存在する文書の翻訳結果は、質の悪いものとなる。しかし、辞書のメンテナンスは非常にコストがかかり、新語や、時事的な単語を辞書に継続的に登録することは容易ではない。本研究では、このような機械翻訳の辞書を補完するという目標のもとに、Wikipediaの言語間リンクを用いて中日の翻訳辞書を作成する方法を提案する。また、この翻訳辞書の活用事例として、多言語ニュースサイトの比較分析システムNSContrastの紹介を行う。, 一般社団法人電子情報通信学会, 日本語 - ナノ知識探索プロジェクト:実験記録からの知識発見
吉岡 真治, 冨岡 克広, 原 真二郎, 福井 孝志, 人工知能学会全国大会論文集, 2010, 0, 1B33, 1B33, 2010年ナノ結晶デバイスの開発プロセスにおいては、製造プロセスがデバイスの性質に大きな影響を与えるため、試行錯誤的な実験の繰り返しが必要とされる。しかし、その試行錯誤に関する知識はあまり明示化されていないため、熟練者の「匠の技」である暗黙知に依存している。本研究では、デバイス生成のための実験を行った記録を情報源として、この暗黙知の明示化を支援する実験記録データの活用システムを提案する。
, 一般社団法人 人工知能学会, 日本語 - 特定トピックの日英ブログ収集・分析・類型化 : 事例研究
中崎 寛之, 阿部 佑亮, 宇津呂 武仁, 河田 容英, 福原 知宏, 神門 典子, 吉岡 真治, 中川 裕志, 清田 陽司, 情報処理学会研究報告. 自然言語処理研究会報告, 194, 9, I1, I8, 2009年11月16日
我々は,これまで,ブログ空間中に存在する有用な情報や知識に的確にアクセスし利用するという目的のもとで,体系化された知識体系である Wikipedia とブログサイトを対応づける研究を行ってきた.しかし,同一のトピックについて記述しているブログであっても,ブロガーの立場や環境は大いに異なることがわかった.そこで,本研究では,ブログ空間の情報や知識を類型化するための方式の一つとして,「ブロガーの立場」 に着目してブログサイト・ブログ記事を類型化するというアプローチをとる.具体的には,本稿では,特定トピックについてのブログに含まれる情報の有用性を検証するための事例研究として,「詐欺」,「インターネット犯罪」 の分野を対象として,日英ブログサイトおよびブログ記事の収集を行い,ブログでの記述内容を被害者・ニュース記事引用・防止対策に類型化した結果を報告する.日英各言語のブログサイト・ブログ記事の収集には,ある同一トピックについて詳しい記述をしているブログサイトを検索する手法と,検索エンジンによるブログ記事検索手法を組み合わせて用いた.そして,収集したブログサイト・ブログ記事にはどのようなタイプの立場があるかを分析し,それらを類型化した.Among other domains and topics on which some issues are frequently argued in the blogosphere, the domain of crime is one of the most seriously discussed by various kinds of bloggers. Such information on crimes in blogs is especially valuable for outsiders from abroad who are not familiar with cultures and crimes in foreign countries. This paper proposes a multilingual framework of categorizing people's concerns, reports, and experiences on crimes in their own blogs. First, we refer to Wikipedia as a multilingual terminological knowledge base, and search for Wikipedia entries describing criminal acts. In the retrieval of blog feeds/posts, we take two approaches, focusing on various types of bloggers such as experts in the crime domain and victims of criminal acts. We further categorize the retrieved blog feeds/posts into four types including experts in the crime domain and victims of criminal acts., 情報処理学会, 日本語 - Wikipedia を介した関連ニュース・ブログの対応付け : Wikipedia エントリの分析
佐藤 由紀, 横本 大輔, 中崎 寛之, 宇津呂 武仁, 吉岡 真治, 福原 知宏, 神門 典子, 中川 裕志, 清田 陽司, 情報処理学会研究報告. 自然言語処理研究会報告, 194, 10, J1, J8, 2009年11月16日
本研究では,検索エンジン等を用いた検索行動のうちでも,特に,客観的かつ恒久的な事実を記載した Wikipedia,詳細な事実情報を報道するニュース,および,個人の主観的意見や経験などを豊富に記載したブログの検索に焦点を当てて,利用者の検索行動を支援する枠組みを提供することを目的とする.本論文では,Wikipedia エントリを介して,関連するニュース・ブログを対応付ける方式において,各 Wikipedia エントリの有効性を分析し,ニュース・ブログ間の相補的検索において Wikipedia エントリを選別するためのインタフェースを設計する.特に,本稿では,Wikipedia エントリを介して,ニュース記事に関連するブログ記事を検索する方式を評価した.システムが提示した Wikipedia エントリのうち,入力となるニュース記事と密接に関連するエントリを利用者が自在に選択し,選択されたエントリのみを用いて関連ブログ記事の検索を行うための相補的ナビゲーション・インタフェースを作成した.評価実験の結果,利用者が適切なエントリの選択を行うことによって,ブログ記事検索結果における関連ブログ記事の割合を大幅に改善することができた.We study complementary navigation of news and blog, where Wikipedia entries are utilized as fundamental knowledge source for linking news articles and blog feeds/posts. In the proposed framework, given a topic as the title of a Wikipedia entry, its Wikipedia entry body text is analyzed as fundamental knowledge source for the given topic, and terms strongly related to the given topic are extracted. Those terms are then used for ranking news articles and blog posts. In the scenario of complementary navigation from a news article to closely related blog posts, Japanese Wikipedia entries are ranked according to the number of strongly related terms shared by the given news article and each Wikipedia entry. Then, top ranked 10 entries are regarded as indices for further retrieving closely related blog posts. All the retrieved blog posts are finally ranked all together. The retrieved blog posts are then shown to users as blogs of personal opinions and experiences that are closely related to the given news article. In our preliminary evaluation, through an interface for manually selecting relevant Wikipedia entries, the rate of successfully retrieving relevant blog posts improved., 情報処理学会, 日本語 - 複数国ニュースサイトの比較対象分析システム NSContrast における評価手法に関する検討
吉岡 真治, 情報処理学会研究報告. DD, [デジタル・ドキュメント], 71, 1, A1, A8, 2009年06月05日
本研究では、複数国のニュースサイトにおける興味の違いを比較対照分析するためのシステム NSContrast を提案している。この NSContrast では、各国のニュースサイトの日本語版の記事だけではなく、原語版の機械翻訳結果も組み合わせたデータベースをもとに、共起語解析やバースト解析を行うことにより、その違いを分析する。本発表では、この NSContrast における評価手法についての検討結果を分析実験の結果と共に報告する。In this research we have already proposed a news site analysis system NSContrast that characterizes the differences among news sites from multiple countries. In this analysis system, news articles database are constructed by using following three types of news sites data; Japanese news articles written in Japanese, foreign ones written in Japanese and machine translated version of foreign ones written in foreign language. In this paper, we discuss how to evaluate the effectiveness of the NSContrast and briefly introduced the result of user experiment study., 情報処理学会, 日本語 - Web リンク活用のためのアンカーテキストの自動分類の研究
大塚 博紀, 吉岡 真治, 情報処理学会研究報告. 情報学基礎研究会報告, 94, 35, 9, 14, 2009年03月18日
Web文書の特徴はリンクによりお互いの文書の関係が示されている点にあり、この情報はPageRankに代表されるWeb空間の解析手法に用いられている。しかし、これらの解析では、サイト内、サイト外といった分類は考慮されているものの、ページの中でのアンカーテキストの役割には、注目していない。本研究では、このアンカーテキストの役割の違いに注目し、適切に分類することで、リンク構造解析やWebページ上でのユーザーの行動解析に役立てる事を目標としている。本稿では、人手による役割分析の結果に基づいたアンカーテキストの自動分類システムを提案する。また、その有効性を検証するために、実際に人手の分類とシステムの出力を比較した結果について報告する。, 一般社団法人情報処理学会, 日本語 - Wikipediaを知識源とするニュース・ブログ間のトピック対応付け
佐藤由紀, 中崎寛之, 川場真理子, 宇津呂武仁, 吉岡真治, 福原知宏, 中川裕志, 神門典子, 言語処理学会年次大会発表論文集, 15th, 300-303, 2009年03月02日
日本語 - 多言語ニュースの対照分析のためのWikipedia活用手法の研究
吉岡 真治, 人工知能学会全国大会論文集, 2009, 0, 2G1NFC58, 2G1NFC58, 2009年本研究では、様々な国から発信される多言語ニュースに対し、機械翻訳システムを利用して対照比較を行うNSContrastの研究を行っている。本システムの分析には、翻訳間違いや表記の違いが解析に大きな影響を与えるため、正規化が必要である。本稿では、Wikipediaの言語間リンクを用いた翻訳用辞書の生成や、redirectの関係を用いた表記のバリエーションへの対応を行い、実運用における評価を行う。
, 一般社団法人 人工知能学会, 日本語 - Universal Abduction Studioの開発(第17報):自動視点情報付与による仮説的知識生成手法
杉山 明紀, 下村 芳樹, 千葉 龍介, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2009, 0, 211, 212, 2009年
創造的設計のためには,異領域知識間の柔軟な統合が重要であると考えられており,著者らはそれを実現する統合計算機環境の開発を行っている.本稿では,知識中に記述される語彙情報から階層構造と単位次元により表現する視点情報を計算機により自動的に推定・付与するシステムを提案・開発する.また,視点情報に基づき生成する仮説的知識の創造性と有用性を可変とする操作性を,事例を用いた検証により確認する., 公益社団法人 精密工学会 - Universal Abduction Studioの開発(第18報):Web 情報を用いた創造的設計支援のための設計知識獲得手法
高橋 潔考, 杉山 明紀, 下村 芳樹, 舘山 武史, 千葉 龍介, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2009, 0, 209, 210, 2009年
前報までに、著者らは創造的設計の総合支援環境であるUniversal Abduction Studio(UAS)で利用するための設計に有用な情報を、Web上から自動取得し、当該システム用の知識ベースを構築するための基本手法を提案した。本稿では、上記提案手法を計算機上の一連のソフトウェアとして実装した内容と、実装システムにより取得された知識の設計上の利用可能性のさらに詳細な検証結果について報告する。, 公益社団法人 精密工学会, 日本語 - 物語の構造汎化一結束性と展開構造の類似性 (「AIを深化させるための基本問題」および一般)
原口 誠, 吉岡 真治, 人工知能基本問題研究会, 70, 0, 49, 52, 2008年07月04日
人工知能学会, 日本語 - 語彙的結束性を利用した複数の物語の共通構造把握 (ことば工学研究会(第28回)テーマ:創る)
井川 拓, 原口 誠, 吉岡 真治, ことば工学研究会, 28, 0, 31, 34, 2008年03月28日
ことば工学事務局, 日本語 - 編集にあたって「情報処理学会論文誌:データベース(電子情報通信学会データ工学研究専門委員会共同編集)」編集委員長
角谷 和俊, 吉岡 真治, 佐藤 哲司, 情報処理学会論文誌データベース(TOD), 49, 7, i, iii, 2008年03月15日
日本語 - ハイパーリンク活用のためのアンカーテキストの役割分析と分類の研究
大塚 博紀, 吉岡 真治, 全国大会講演論文集, 70, 0, 209, 210, 2008年03月13日
社団法人情報処理学会, 日本語 - 表層格タグ付け知識を用いた創造的設計支援のための知識表現
杉山明紀, 下村芳樹, 吉岡真治, 武田英明, 日本機械学会設計工学・システム部門講演会論文集(CD-ROM), 18th, 2008年 - IR interface for contrasting multiple news sites
Masaharu Yoshioka, INFORMATION RETRIEVAL TECHNOLOGY, 4993, 508, 513, 2008年, [査読有り]
In order to utilize news articles from multiple news sites, it is better to understand the characteristics of each news site. In this paper, a concept of contrast set mining is applied for analyzing the characteristic difference between each news site and all others. The News Site Contrast (NSContrast) system is also proposed based on this mining technique. This system is applied to a news article database constructed from multiple news sites from different countries in order to evaluate its effectiveness., SPRINGER-VERLAG BERLIN, 英語 - Web文書におけるアンカーテキストの役割分析と自動分類の研究
大塚 博紀, 吉岡 真治, 人工知能学会全国大会論文集, 8, 0, 203, 203, 2008年
本研究では、Webのリンク構造を分類して利用することを目標として、アンカーテキストの情報を用いたリンクの役割分析を行っている。本発表では、役割分類の基準とそれに基づいた自動分類の手法について提案する。, 一般社団法人 人工知能学会, 日本語 - 創造的設計支援のための格文法と物理量情報を用いるタグ付け知識作成手法
杉山明紀, 下村芳樹, 千葉龍介, 吉岡真治, 武田英明, Designシンポジウム講演論文集, 2008, 441-446, 2008年
日本語 - Universal Abduction Studioの開発(第13報):創造的設計を支援する統合計算機環境
中西 雅俊, 鈴木 遼, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2008, 0, 435, 436, 2008年
本研究では創造的設計を総合的に支援する計算機環境の構築を目指している。著者らは、これまでに創造的設計を支援するための知識記述形式や推論機構、オントロジー利用の枠組みなどを提案してきた。しかしながらこれらを用いて創造的な設計を支援するためには以上の構成要素群を統合する必要がある。本稿では創造的設計を支援するための統合計算機環境を提案し、その具体的な実装構造を例示する。, 公益社団法人 精密工学会, 日本語 - Universal Abduction Studioの開発(第14報):Web情報を用いた設計知識情報データベースの拡充手法
高橋 潔考, 鈴木 遼, 下村 芳樹, 舘山 武史, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2008, 0, 437, 438, 2008年
近年、人工物に対する要求がより高度化・複雑化することに伴い、設計者による包括的な問題解決が求められている。以上の背景のもと、著者らは創造的設計を総合的に支援する計算機環境Universal Abduction Studio(UAS)を提案している。本稿では、情報抽出の手法を用いてWeb情報から設計に有用な情報を取得することにより、UASの設計知識データベースを効率的に拡充するための手法を提案する。, 公益社団法人 精密工学会, 日本語 - Universal Abduction Studioの開発(第15報):創造的設計支援のための知識表現形式―表層格と物理量情報に基づくタグ付け手法
杉山 明紀, 下村 芳樹, 千葉 龍介, 武田 英明, 吉岡 真治, 精密工学会学術講演会講演論文集, 2008, 0, 647, 648, 2008年
著者らは,創造的設計を支援する統合計算機環境の構築を行っている.これまでに,語彙情報をタグ付けした知識から概念類似度を基に生成される仮説的知識の有用性向上手法を提案しているが,場面に即した仮説的知識を効率的に取得するためには語彙の属性に基づくタグ付け手法とそれを用いた推論が有効である.本稿では,知識に対して語彙情報に基づく物理量をタグ付けする知識表現手法を提案し,その有効性を検証する., 公益社団法人 精密工学会, 日本語 - Universal Abduction Studioの開発(第16報):Web情報を用いた設計知識データベースの拡充手法
高橋 潔考, 杉山 明紀, 下村 芳樹, 舘山 武史, 千葉 龍介, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2008, 0, 649, 650, 2008年
近年,人工物に対する要求の高度化・複雑化に伴い,設計者に対する負担が一層増大している.以上の背景のもと,著者らは創造的設計を総合的に支援する計算機環境Universal Abduction Studio(UAS)を提案している.本稿では,設計に有用な情報をWeb情報より自動的に取得,UASで利用可能な知識表現に変換することにより,UASの設計知識データベースを効率的に拡充するための手法を提案する., 公益社団法人 精密工学会, 日本語 - 1311 表層格タグ付け知識を用いた創造的設計支援のための知識表現
杉山 明紀, 下村 芳樹, 吉岡 真治, 武田 英明, 設計工学・システム部門講演会講演論文集, 2008, 0, 181, 185, 2008年
In order to realize a creative design, it is thought to be important to unify the knowledge from different knowledge areas flexibly. The computer environment that supports designers in an integrated way has been developed. The extended method of the knowledge representation forms for increasing the usefulness of the hypothetical knowledge from the knowledge tagged with vocabulary information was proposed. However, the current method isn't always capable of obtaining the useful knowledge, since it doesn't consider the context. In order to acquire the hypothetical knowledge adapted to the context efficiently, the tagging technique based on the attribute of a vocabulary and the reasoning using it are effective. In this paper, the authors propose knowledge representation forms for tagging physical quantity based on vocabulary describing knowledge, and verify the usefulness of the proposed method., 一般社団法人 日本機械学会, 日本語 - 2302 Web情報を用いた設計知識情報データベースの拡充手法
高橋 潔考, 下村 芳樹, 舘山 武史, 吉岡 真治, 武田 英明, 設計工学・システム部門講演会講演論文集, 2008, 0, 305, 309, 2008年
In recent years, comprehensive problem solving by a designer has been required as the demand for an artifact grows and complicates more. In the above background, we have proposed Universal Abduction Studio (UAS), a computer environment, which supports a creative design synthetically. However, it is difficult for designers to acquire knowledge in multiple domains efficiently because they have to accumulate the design knowledge by the handwork. Thus far, we proposed Web-based design knowledge information database extension method. In this paper, we propose the conversion method acquired design knowledge information from the resource on Web into knowledge expression for UAS., 一般社団法人 日本機械学会, 日本語 - 編集にあたって「情報処理学会論文誌:データベース(電子情報通信学会データ工学研究専門委員会共同編集)」編集委員長
角谷 和俊, 吉岡 真治, 佐藤 哲司, 情報処理学会論文誌データベース(TOD), 48, 20, i, iii, 2007年12月15日
日本語 - マイナーなテキスト情報をも活用する情報アクセス技術
吉岡 真治, ヒューマンインタフェース学会誌 = Journal of Human Interface Society : human interface, 9, 4, 269, 274, 2007年11月25日
ヒュ-マンインタフェ-ス学会, 日本語 - 格文法分類と知識テンプレートに基づく知識表現
杉山明紀, 鈴木遼, 中西雅俊, 下村芳樹, 吉岡真治, 武田英明, 日本機械学会設計工学・システム部門講演会講演論文集, 17th, 286-287, 2007年10月30日
日本語 - Univeral Abduction Studioの開発(第12報)—格分類と知識テンプレートに基づく知識表現—
杉山明紀, 鈴木遼, 中西雅俊, 下村芳樹, 吉岡真治, 武田英明, 精密工学会大会学術講演会講演論文集, 2007, G67, 2007年09月03日
日本語 - 適合的汎化に基づく情報検索システムの実験的研究
吉岡 真治, 原口誠, NICT-EDR電子化辞書シンポジウム, -, -, 67, 76, 2007年04月
日本語, 記事・総説・解説・論説等(学術雑誌) - 複数のニュース源の差異を考慮したニュース分析の研究,「大規模Web研究基盤上での自然言語処理・情報検索」
吉岡真治, 言語処理学会第13回年次大会ワークショップ (W2), 27, 30, 2007年03月
日本語, 記事・総説・解説・論説等(学術雑誌) - 特集「情報爆発時代に向けた新しいIT基盤技術の研究」にあたって(<特集>情報爆発時代に向けた新しいIT基盤技術の研究)
吉岡 真治, 矢入 郁子, Masaharu Yoshioka, Ikuko Yairi, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 22, 2, 208, 208, 2007年03月01日
社団法人人工知能学会, 日本語 - 特集「情報爆発時代に向けた新しいIT基盤技術の研究」にあたって
吉岡 真治, 矢入 郁子, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 22, 2, 208, 208, 2007年03月01日
日本語 - 特集「情報爆発時代に向けた新しいIT基盤技術の研究」にあたって(<特集>情報爆発時代に向けた新しいIT基盤技術の研究)
吉岡 真治, 矢入 郁子, 人工知能, 22, 2, 208, 208, 2007年
一般社団法人 人工知能学会, 日本語 - 情報源の特性を考慮した情報アクセス(<特集>編集委員2007年の抱負)
吉岡 真治, Masaharu Yoshioka, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 22, 1, 15, 15, 2007年01月01日
社団法人人工知能学会, 日本語 - 3110 格文法分類と知識テンプレートに基づく知識表現(OS9-4 ライフサイクル設計とサービス工学-IV)知識表現)
杉山 明紀, 鈴木 遼, 中西 雅俊, 下村 芳樹, 吉岡 真治, 武田 英明, 設計工学・システム部門講演会講演論文集, 2007, 0, 286, 287, 2007年
In order to realize a creative design, it is thought to be important to unify the different knowledge group flexibly, and the concept of the computer environment which supports designers in an integrated way has been proposed. Our project, called Universal Abduction Studio, aims at assisting designers in obtaining design solutions through the dynamic interaction between a system and a designer. In this report, we propose the extended method of the knowledge representation forms for increasing the usefulness of hypothetical knowledge, after considering the existing reasoning environment. Finally, the usefulness of the proposed method is verified., 一般社団法人 日本機械学会, 日本語 - Universal Abduction Studioの開発(第12報):格分類と知識テンプレートに基づく知識表現
杉山 明紀, 鈴木 遼, 中西 雅俊, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2007, 0, 523, 524, 2007年
創造的な設計を実現するためには異領域知識間の柔軟な統合が重要と考えられ,それを総合的に支援する計算機環境であるUniversal Abduction Studioの概念が提案されている.本稿では,これまでに著者らが提案した推論機構に関する考察を行なった上で,計算機が導出する仮説的知識の有用性を,各分類と知識テンプレートの導入により向上させる知識表現形式の拡張方法を提案し,その有効性を検証する., 公益社団法人 精密工学会 - Web情報を用いた設計知識情報データベースの拡充手法
高橋 潔考, 鈴木 遼, 下村 芳樹, 舘山 武史, 吉岡 真治, 武田 英明, 横幹連合コンファレンス予稿集, 2007, 0, 45, 45, 2007年
近年,人工物に対する要求がより高度化・複雑化することに伴い,設計者による包括的な問題解決が求められている.以上の背景のもと,著者らは創造的設計を総合的に支援する計算機環境Universal Abduction Studio(UAS)を提案している.本稿では, Web上のリソースから設計に有用な情報を抽出することにより,UASにおいて利用される設計知識情報データベースをより拡充する手法を提案する., 横断型基幹科学技術研究団体連合(横幹連合), 日本語 - 特許検索のための物理法則概念による文書分類の研究
吉岡 真治, 落合 翔平, 精密工学会学術講演会講演論文集, 2007, 0, 513, 514, 2007年
TRIZなどに代表されるようにアイディア検索のために特許を利用する方法が提案されている。このような状況では、表面上の表記に注目した同分野の特許を検索するのではなく、類似の問題を扱っている特許を検索することが重要となる。本研究では、アイディアの根幹にある物理法則をキーとした検索を考え、学習により文書に対して関連物理法則のラベルをつけ、分類する方法を提案する。, 公益社団法人 精密工学会, 日本語 - Web情報活用のためアンカーテキストの分類と利用(文書分類・評判分析)
吉岡 真治, 情報処理学会研究報告. 自然言語処理研究会報告, 2006, 94, 27, 33, 2006年09月12日
Web情報の最も大きな特徴は、ハイパーリンクにより、複数のページが関係付けられ、その関係がアンカーテキストという形で記述されている点にある。本研究では、大規模なWeb文書コレクションであるるNTCIRのnw100gテストコレクションから抽出したアンカーテキストを対象に、アンカーテキストの機能分類を提案すると共に、機能分類の自動化のための方針、機能分類の特徴を生かしたWeb情報活用システムの応用手法について述べる。, 一般社団法人情報処理学会, 日本語 - Web 情報活用のためアンカーテキストの分類と利用
吉岡 真治, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 84, 94, 27, 33, 2006年09月12日
Web情報の最も大きな特徴は、ハイパーリンクにより、複数のページが関係付けられ、その関係がアンカーテキストという形で記述されている点にある。本研究では、大規模なWeb文書コレクションであるるNTCIRのnw100gテストコレクションから抽出したアンカーテキストを対象に、アンカーテキストの機能分類を提案すると共に、機能分類の自動化のための方針、機能分類の特徴を生かしたWeb情報活用システムの応用手法について述べる。, 一般社団法人情報処理学会, 日本語 - 創造的設計支援のための仮説的知識生成支援環境 Universal Abduction Studio (テーマ:特集「スキルサイエンス」および一般)
吉岡 真治, 佐藤 孝彦, 森本 憲悟, 人工知能基本問題研究会, 62, 0, 71, 76, 2006年03月27日
人工知能学会, 日本語 - Universal Abduction Studioの開発(第9報)—創造的設計支援のための知識記述エディタの開発—
伊東真樹, 森本憲悟, 下村芳樹, 武田英明, 吉岡真治, 精密工学会大会学術講演会講演論文集, 2006, M22, 2006年03月01日
日本語 - Universal Abduction Studioの開発(第8報)—創造的設計支援のためのオントロジー構造—
中西雅俊, 森本憲悟, 下村芳樹, 武田英明, 吉岡真治, 精密工学会大会学術講演会講演論文集, 2006, M21, 2006年03月01日
日本語 - Universal Abduction Studioの開発(第10報)—対話型進化的計算法に基づく仮説的な設計知識の生成手法の提案—
森本憲悟, 下村芳樹, 吉岡真治, 武田英明, 上田完次, 精密工学会大会学術講演会講演論文集, 2006, M23, 2006年03月01日
日本語 - 115 創造的設計のための仮説的知識生成支援の研究(創造・創発〔II〕)
吉岡 真治, 佐藤 孝彦, 杉山 明紀, 森本 憲悟, 武田 英明, 下村 芳樹, Designシンポジウム講演論文集, 2006, 0, 95, 100, 2006年
In order to design new artifacts that are different from existing ones, it is crucial to have new knowledge for the design problem. We have already confirmed that combination of existing knowledge from different domain may useful for this process by analyzing design cases. In this paper, we briefly review our hypothetical knowledge generation support environment "Universal Abduction Studio" (UAS) and propose an automatic method to organize design document for this environment., 日本機械学会, 日本語 - 2303 透過型オントロジーによるターミノロジー管理(OS2 ライフサイクル設計とサービス工学II:ツール,未来社会を支えるものづくりとひとづくり(設計・システムから))
中西 雅俊, 鈴木 遼, 下村 芳樹, 武田 英明, 吉岡 真治, 設計工学・システム部門講演会講演論文集, 2006, 0, 206, 207, 2006年
We argue that abduction for integrating theories can be a basic principle to formalize creative design processes. Based on this principle, we have proposed Universal Abduction Studio, a design environment in which designers combine different theories to arrive at better design. In this new approach to computational support of conceptual design, the system should offer various types of abductive reasoning from which designers can select an interesting design method. This paper aims at proposing the method of handling terminology by general common ontology and managing in the multiple. We also discuss technologies to implement proposed method of managing terminology., 一般社団法人 日本機械学会, 日本語 - 創造的設計支援に用いる仮説的設計知識生成のための自動文書タグ付け手法の提案
吉岡 真治, 佐藤 孝彦, 森本 憲悟, 武田 英明, 下村 芳樹, 人工知能学会全国大会論文集, 6, 0, 202, 202, 2006年
従来の設計解とは本質的に異なる創造的な設計解を作るためには、既存の知識の単純な組合わせではなく、新たな設計知識の利用が不可欠である。本研究では、これまで、異なる領域知識間に存在する類似性をキーとしたアナロジーを用いて、仮説的設計知識の生成手法を提案してきた。本発表では、このアナロジーを行なうために必要な文書情報のタグ付けを自動化するための方法論について述べる。, 一般社団法人 人工知能学会, 日本語 - Universal Abduction Studioの開発(第9報):創造的設計支援のための知識表現形式の提案
伊東 真樹, 森本 憲悟, 下村 芳樹, 武田 英明, 吉岡 真治, 精密工学会学術講演会講演論文集, 2006, 0, 1001, 1002, 2006年
設計課題に関連する領域知識を用いるだけでは,創造的な設計解を得ることは困難である.本研究では創造的設計実現のためには,設計課題に関する領域知識とそれとは異なる領域知識の統合が重要であると考え,これを総合的に支援する計算機環境の構築を目指している.本稿ではより高度な知識統合を実現するために,知識の意味的構造に基づく統合を可能とする知識表現形式とその形式に従い知識を記述するためのエディタを提案する., 公益社団法人 精密工学会 - Universal Abduction Studioの開発(第10報):対話型進化的計算法に基づく仮説的な設計知識生成手法の提案
森本 憲悟, 下村 芳樹, 武田 英明, 吉岡 真治, 上田 完次, 精密工学会学術講演会講演論文集, 2006, 0, 1003, 1004, 2006年
既知の知識のみからでは解を導出することが困難な創造的設計においては、新たな知見の導入や発想による知識の拡張が必要である。本研究ではこのような創造的設計過程の理解、および、それを総合的に支援するための計算機環境の構築を目指している。本稿ではこの創造的設計における知識拡張に必要な仮説的知識の生成を対話型進化的計算法に基づいて行う手法を提案する。さらに機能展開の知識に適用し提案手法の有効性を検証する。, 公益社団法人 精密工学会 - Universal Abduction Studioの開発(第11報):透過型オントロジーによるターミノロジー管理
中西 雅俊, 鈴木 遼, 下村 芳樹, 武田 英明, 吉岡 真治, 精密工学会学術講演会講演論文集, 2006, 0, 109, 110, 2006年
前報では,異領域知識の統合を,オントロジーと格文法を用いた知識記述により実現する方法を提案した.しかし異領域知識の統合を多様な領域において柔軟に適用するためには,各設計知識上に現れる領域固有のターミノロジーを管理するための方法を用意する必要がある.本稿ではターミノロジーを一般的な共通オントロジーと多重的に管理することにより,ターミノロジーを取り扱う方法を提案し,実際の設計知識への適用例を示す., 公益社団法人 精密工学会, 日本語 - Overview of the NTCIR-5 WEB Query Term Expansion Subtask. In Proceedings of the Fifth NTCIR Workshop Meeting on Evaluation of Information Access Technologies, National Institute of Informatics, 2005.
Masaharu Yoshioka, Information Retrieval, Question Answering and Cross-Lingual Information Access, 443, 454, 2005年12月
英語, 記事・総説・解説・論説等(学術雑誌) - 情報検索における検索語拡張手法の有用性分析手法の提案
吉岡 真治, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 81, 108, 53, 60, 2005年11月02日
検索語拡張手法は、ユーザの持っている検索要求に応じた検索語を初期検索語に追加することにより検索性能を向上させる技術であり、多くのシステムで用いられ、その効果が確認されている。しかし、この手法が検索性能に与える効果は、様々な要因と関係しているため、検索語拡張手法の持つ性質を分析する方法に関しては十分議論されているとはいえない。そこで、本研究では、検索語拡張手法を分析するために、その有用性に影響を与えると考えられる要素の整理を行なう。また、実際の検索実験の結果に基づき、検索語拡張手法の分析を行なう。, 一般社団法人情報処理学会, 日本語 - 情報検索における検索語拡張手法の有用性分析手法の提案 (情報処理学会情報学基礎研究会(FI)第81回 発表論文)
吉岡 真治, Yoshioka Masaharu, ディジタル図書館, 29, 55, 62, 2005年11月
ディジタル図書館編集委員会, 日本語 - 情報検索のテストコレクションにおける検索語の有用性に関する検討
吉岡 真治, 情報処理学会研究報告. データベース・システム研究会報告, 136, 42, 25, 30, 2005年09月19日
多くの情報検索システムの利用者にとって、情報要求を適切に表現する検索語を選択することは必ずしも容易ではない。その結果として、検索要求と検索語の間にギャップが生じることがあり、そのギャップが検索課題の難易度に影響を与えると考えられる。そこで、本論文では、情報検索のテストコレクションにおける検索語の有用性を検討するために有用であると考えられる指標を提案すると共に、検索性能への影響の相関性を調べる。, 一般社団法人情報処理学会, 日本語 - Double-Decker RFID Tags : Basic Structures and Applications(Paper Session 8 (uT Technology))
Shin-ichiMinato, Masaharu Yoshioka, 情報処理学会研究報告. UBI, [ユビキタスコンピューティングシステム], 2005, 60, 497, 501, 2005年06月09日
For tracing or finding the lost goods, we need active-type of RFID tags with built-in batteries, but those active tags have significant drawbacks such as the higher hardware cost and the finite battery lifetime. In this paper, we propose "double-decker" RFID tags, which can be separated into the two parts of ID tags. The new type of RFID tag is useful and cost-effective for tracing/keeping of a large number of goods. We present the basic structures of the double-decker tags and show some typical applications., 社団法人情報処理学会, 英語 - 情報検索のテストコレクションにおける検索語の有用性に関する検討
吉岡 真治, 情報処理学会研究報告情報学基礎(FI), 2005, 42, 25, 30, 2005年05月19日
多くの情報検索システムの利用者にとって、情報要求を適切に表現する検索語を選択することは必ずしも容易ではない。その結果として、検索 要求と検索語の間にギャップが生じることがあり、そのギャップが検索課題の難易度に影響を与えると考えられる。そこで、本論文では、情報検索のテストコレクションにおける検索語の有用性を検討するために有用であると考えられる指標を提案すると共に、検索性能への影響の相関性を調べる。In many cases, it is not easy for a user of Information Retrieval (IR) to select appropriate query terms for representing his/her information need. Since this mismatch between query terms and information need affects the topic difficulty, it is better to have a framework to evaluate the effectiveness of the query terms. Therefore, in this paper, I propose some feature quantities that characterize quality of initial query in test collection. I also analyze correlation coefficient between these quantities and retrieval performance by using NTCIR-4 web test collection., 一般社団法人情報処理学会, 日本語 - 人間と人工知能の得手不得手(<特集>ようこそ人工知能の世界へ : 編集委員今年の初夢)
吉岡 真治, Masaharu Yoshioka, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 20, 3, 268, 268, 2005年05月01日
社団法人人工知能学会, 日本語 - 人間と人工知能の得手不得手
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 20, 3, 268, 268, 2005年05月01日
日本語 - 1405 概念ネットワークを活用したアナロジーによる仮説的設計知識の生成手法(OS1 ソフト人工物II)
森本 憲悟, 鬼城 渉, 下村 芳樹, 吉岡 真治, 武田 英明, 上田 完次, 設計工学・システム部門講演会講演論文集, 2005, 0, 168, 171, 2005年
It is important to unify different knowledge groups, which exist independently, and to extend knowledge gradually in order to obtain creative design solutions that are not obtained only with the existing design knowledge. With the aim of development of "Universal Abduction Studio", which is a system supporting creative design, a knowledge representation and a matching algorithm for creating hypothetic knowledge is proposed in this paper., 一般社団法人 日本機械学会, 日本語 - 2306 プログラム・マネジメントのための利害関係者ネットワーク抽出支援の研究(OS07 設計におけるナレッジマネジメントII)
吉岡 真治, 設計工学・システム部門講演会講演論文集, 2005, 0, 334, 337, 2005年
Program management aims to support a management for a large and complex project. We have already proposed a framework for supporting this management process by reviewing a program from three different aspects (i.e., process planning, related information, and stake holder networks). However, this system only supports to represent and review a program by using manually inputted information. In this paper, I proposed a system that extract stakeholders information from a text to support constructing stake holder network. In this system, we categorize stakeholders in two types. One is collaborator and the other is opponent. For extracting these two types of stakeholders, we collected typical expression for describing them and made pattern match rule for extraction. For evaluating our methodology, we implemented the prototype system that uses Japanese newspaper articles as a resource for extraction., 一般社団法人 日本機械学会, 日本語 - 2827 タグ付け手法に基づく創造的設計支援(S61 機械設計における情報共有)
鬼城 渉, 森本 憲悟, 下村 芳樹, 吉岡 真治, 武田 英明, 年次大会講演論文集, 2005, 0, 249, 250, 2005年
When a designer confronts a difficult design problem which cannot be solved only with his/her own knowledge, it is necessary to amplify it by introducing new perspectives and ideas for design. The authors have been developing a integrated computer aided design system for creative design. In this report, the authors propose a knowledge description framework which enables computers to analogize a bit of knowledge to another in a different field. Additionally, a tagging method of knowledge by RDF/XML and the implement of an editing tool for the method are mentioned in this report., 一般社団法人 日本機械学会, 日本語 - プログラムマネジメント支援のためのテキストからの利害関係者の抽出と分類
吉田 守泰, 吉岡 真治, 人工知能学会全国大会論文集, 5, 0, 95, 95, 2005年
大規模で複雑な事業などの支援を目的としたプログラムマネジメントにおいて、関係する利害関係者を理解することは重要な意味を持つ。本研究では、この情報を、新聞記事などのテキストからパタンを用いて抽出・分類する方法を提案する。, 一般社団法人 人工知能学会, 日本語 - アナロジーを用いた仮説的設計知識の生成手法 ―概念ネットワークからのモデルの生成と利用―
森本 憲悟, 鬼城 渉, 藤本 裕, 下村 芳樹, 吉岡 真治, 武田 英明, 人工知能学会全国大会論文集, 5, 0, 282, 282, 2005年
本稿では,設計における問題解決に有効な仮説的知識を生成するために,概念ネッワークから知識モデルを生成し,そのモデルに対してアナロジーを適用する手法を提案する.さらに実験により本手法の有効性を検証する., 一般社団法人 人工知能学会, 日本語 - Universal Abduction Studioの開発(第7報):深層格と構造類似性を用いた知識マッチング
森本 憲悟, 鬼城 渉, 藤本 裕, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2005, 0, 183, 183, 2005年
既知の知識のみからでは解を導出困難であるような創造的設計においては、新たな知見の導入や発想により、知識の拡張をすることが必要となる。著者らはこれまでに、創造的設計を総合的に支援する計算機環境の開発を目指し、アナロジーによって複数の異なる知識群間において新たな知識を獲得するための知識統合手法の提案を行ってきた。本報では、知識の意味を考慮した構造的類似性判定を実現するために、深層格による知識表現に基づく概念のマッチング手法を提案する。さらに本手法を実装したプロトタイプにより、その妥当性·有効性を検証する。, 公益社団法人 精密工学会, 日本語 - Universal Abduction Studioの開発(第6報):拡張RDFに基づく知識エディタの実装
鬼城 渉, 森本 憲悟, 藤本 裕, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2005, 0, 182, 182, 2005年
既知の知識のみからでは解を導出困難であるような創造的設計においては、新たな知見の導入や発想により、知識の拡張をすることが必要となる。著者らはこれまでに創造的設計を総合的に支援する計算機環境の開発を目指し、前報では、意味に基づく知識処理を実現するための知識スキームを提案した。本報では、前報で提案した知識スキームに基づく、RDF/XMLを用いた知識記述形式の提案を行う。さらに提案形式により知識記述を支援する知識エディタの実装状況を報告する。, 公益社団法人 精密工学会, 日本語 - Universal Abduction Studioの開発(第5報)—UASのための知識スキーム—
森本憲悟, 下村芳樹, 藤本裕, 武田英明, 吉岡真治, 精密工学会大会学術講演会講演論文集, 2004, A68, 2004年09月01日
日本語 - 問題解決タスクの類似性に注目した問題解決支援のための文書マネージメントシステム (特集 オントロジー)
吉岡 真治, 五十嵐 優, 人工知能基本問題研究会, 56, 0, 91, 96, 2004年07月25日
人工知能学会, 日本語 - クエリー駆動方式の文書間極大類比構築法
原口 誠, 吉岡 真治, 情報処理学会研究報告. NL,自然言語処理研究会報告, 162, 73, 7, 10, 2004年07月15日
様々な観点から類似していると判断できる文書群から、文書評に内在する共通性を汎化された共通イベント列(極大類比)として抽出し、極大類比に包摂される任意の文書を関連文書と判断するアクセス手法を考える。極大類比を構成する際に必要な計算量を軽減せしめ、かつ同時に関連性判断の精度を向上させる目的で、所与の質問式Qの具体化で事例文書Iの汎化になっている極大類比に限定した構成法を与える。, 一般社団法人情報処理学会, 日本語 - 機能変更を伴うアップグレード設計支援システムの開発
近藤伸亮, 石上佳照, 梅田靖, 下村芳樹, 吉岡真治, Designシンポジウム講演論文集, 2004, 227-230, 2004年07月08日
日本語 - 適合的汎化に基づく情報検索システムの研究(第2報) : 検索語の網羅性に注目した検索インタフェースの作成
吉岡 真治, 原口 誠, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 74, 36, 87, 93, 2004年03月26日
情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案している。本報では、汎化概念の関連文書における網羅性に注目し、検索に役に立つと考えられる汎化概念を明示化するインタフェースの作成について報告する。また、この網羅性に注目することにより、検索意図をより明確に表現するBoolean検索式の構築の支援とWeb検索への応用についても述べる。, 一般社団法人情報処理学会, 日本語 - 適合的汎化に基づく情報検索システムの研究(第2報) -検索語の網羅性に注目した検索インタフェースの作成-
吉岡 真治, 原口 誠, 情報処理学会研究報告デジタルドキュメント(DD), 2004, 36, 87, 93, 2004年03月26日
情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案している。本報では、汎化概念の関連文書における網羅性に注目し、検索に役に立つと考えられる汎化概念を明示化するインタフェースの作成について報告する。また、この網羅性に注目することにより、検索意図をより明確に表現するBoolean検索式の構築の支援とWeb検索への応用についても述べる。It is not easy for a user of Information Retrieval (IR) system to select appropriate keywords. In this research, we proposed a new IR system that uses adaptive generalization of keywords. When the system can selects appropriate generalization by estimating user's intent, the system can generate good keywords that have high readability and good retrieval performance. In this report, we proposed new IR user interface that displaies generalized concepts by using relevant documents information. In addition, we propose a method to construct Boolean retrieval formula by using these generalized concepts and apply this method for Web information retrieval., 日本語 - Study on the combination of probabilistic and boolean ir models for www documents retrieval
YOSHIOKA Masaharu, Working Notes of the Fourth NTCIR Workshop Meeting, Supplement Volume, 2004, 9, 16, 2004年 - Universal Abduction Studioによる創造的設計のための知識スキーム(ソフト人工物III)
森本 憲悟, 藤本 裕, 下村 芳樹, 武田 英明, 吉岡 真治, 設計工学・システム部門講演会講演論文集, 2004, 0, 332, 335, 2004年
In order to obtain a creative design solution, which is not obtained only with existing design knowledge, it is required to unify different knowledge groups, which exist independently, and to perform gradual extension of knowledge. Authors have proposed some knowledge representations and algorithms of knowledge integration for realizing knowledge extension with the aim of development of "Universal Abduction Studio", which supports creative design synthetically. In this paper, the fundamental framework for dealing with information as knowledge is proposed. And the representation and the knowledge integration based on it are proposed., 一般社団法人 日本機械学会, 日本語 - 設計情報の知的処理のためのタグ付け方法の検討
武田 英明, 藤本 裕, 吉岡 真治, 下村 芳樹, 人工知能学会全国大会論文集, 4, 0, 287, 287, 2004年
設計情報を計算機によって知的処理させるためには,テキストに機械処理可能なタグ付けをする必要がある.設計の場合,多様な文脈があるため,一意のタグづけは難しい.そこで本研究では,複数の解釈が可能なタグ付け方法を提案し,書籍の文章を例題にタグづけを試験的におこなった., 一般社団法人 人工知能学会, 日本語 - Universal Abduction Studioの開発(第5報):UASにおける知識スキーム
森本 憲悟, 下村 芳樹, 藤本 裕, 武田 英明, 吉岡 真治, 精密工学会学術講演会講演論文集, 2004, 0, 45, 45, 2004年
既存の設計知識だけでは得られないような創造的な設計解を得るためには、独立
に存在する異なる知識群を統合し、知識の段階的拡張を行うことが必要である。
著者らは創造的設計を総合的に支援する環境・UASの構築を目指し、これまでに
段階的な知識拡張を実現するための、複数の知識表現形式や知識統合の手法を提
案してきた。本報では自然言語などによって記述された情報を知識として取扱う
ための基本的枠組みを提案する。, 公益社団法人 精密工学会 - 問題解決のための知識マネージメントシステムの研究(第3報) -概念階層を利用した類似事例の検索-
吉岡 真治, 五十嵐 優, 人工知能学会全国大会論文集, 4, 0, 130, 130, 2004年
本研究では、ユーザが持つ問題に対し、類似事例などを提示しながら、問題解決を支援する知識マネージメントシステムの研究を行っている。本報では、オントロジーに基づく概念定義を利用した類似事例の検索と再利用の方法について述べる。, 一般社団法人 人工知能学会, 日本語 - 機能変更を伴うアップグレード設計支援システムの開発
石上 佳照, 近藤 伸介, 梅田 靖, 下村 芳樹, 吉岡 真治, 精密工学会学術講演会講演論文集, 2004, 0, 297, 297, 2004年
アップグレード設計は、単に製品の物理的寿命を延長するだけでなく、機能的寿命を延長する設計手法である。本稿では、機能変更を伴う(e.g. 片面コピー機に二世代目で両面コピー機能を追加)アップグレード設計を扱う。従来、著者らが提案してきたアップグレード設計方法論に基づき、設計支援システムを開発し、実行例を述べ、本方法論の有効性を検証する。, 公益社団法人 精密工学会, 日本語 - Universal Abduction Studioの開発(第4報):UASのための多重解釈型知識表現
藤本 裕, 野間口 大, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2004, 0, 197, 197, 2004年
対象固有の領域知識を用いるだけでは、既存の設計解を改良することは可能であっても創造性の高い設計を支援することは困難である。即ち、創造性の高い設計を支援するためには、異なる領域に属する知識を互いに関連づけることによる問題の再定義や、新しい知識を作成するための手段が必要である。本報では、前報ですでに提案したオントロジーを用いた知識表現の枠組みとその評価結果に基づき、より柔軟な知識利用を実現するための新しい知識表現の手法を提案するとともに、その有効性について検証する。, 公益社団法人 精密工学会, 日本語 - NTCIRプロジェクト
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 19, 1, 127, 128, 2004年01月01日
社団法人人工知能学会, 日本語 - 言語情報処理ポータル
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 18, 3, 367, 368, 2003年05月01日
社団法人人工知能学会, 日本語 - 特集「Intelligent Manufacturing Systems:IMS」にあたって(<特集>Inteligent Manufacturing Systems:IMS)
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 18, 2, 107, 107, 2003年03月01日
社団法人人工知能学会, 日本語 - 特集「Intelligent Manufacturing Systems:IMS」にあたって(<特集>Inteligent Manufacturing Systems:IMS)
吉岡 真治, 人工知能, 18, 2, 107, 107, 2003年
一般社団法人 人工知能学会, 日本語 - 2816 将来の不確実性を考慮したアップグレード設計支援システムの開発
石上 佳照, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治, 年次大会講演論文集, 2003, 0, 323, 324, 2003年
The objective of upgrade design is to extend product life so as to reduce consumption volume of resources and energy usage. However, difficulty of upgrade design resides within prediction of future trend such as technological trends and market trends, and upgrade design should be robusts against uncertainty of future predection. This paper proposes a design methodology for upgradable products, and illustrates a prototype upgrade design support tool which can handle changes of user requirement and market trend. With a design example of a vacuume cleaner, this papar also demonstrates the features of the upgrade design tool., 一般社団法人 日本機械学会, 日本語 - 2103 創造的設計のための仮説的知識の生成手法
吉岡 真治, 野間口 大, 藤本 裕, 下村 芳樹, 武田 英明, 設計工学・システム部門講演会講演論文集, 2003, 0, 189, 191, 2003年
Since previous designer may already generate possible combination of existing domain knowledge, it is difficult to design creative solution without creating innovative knowledge. We have already confirmed that combination of existing knowledge from different domain may useful for this process by analyzing design cases. In this paper, we propose methodology to generate hypothetical knowledge for creative design by combining existing knowledge., 一般社団法人 日本機械学会, 日本語 - 設計における創造性支援環境「ユニバーサル・アブダクション・スタジオ」の提案
武田 英明, 坂井 宏充, 野間口 大, 吉岡 真治, 下村 芳樹, 冨山 哲男, 人工知能学会全国大会論文集, 3, 0, 183, 183, 2003年
本研究の目的は、設計の創造過程を表現し、計算機上で支援する環境を構築することである。設計の創造的活動はアブダクション、特に理論を統合するアブダクションとしてモデル化することができる。理論を統合するアブダクションの実現には多様なアブダクションのスキーマが併せて利用されるが、ここではアナロジーに基づくアブダクションに注目して、アナロジーに基づく知識統合による設計支援システムのプロトタイプを構築した。, 一般社団法人 人工知能学会, 日本語 - 物語性を考慮した要約に基づく類似文書の汎化
原口 誠, 吉岡 真治, 溝江 彰人, 四ッ谷 雅輝, 人工知能学会全国大会論文集, 3, 0, 189, 189, 2003年
類似文書群の中で初めて言葉の重要度と関連性が定まるとの立場から、物語性を考慮した文の重要度に基づく文書汎化手法を提案する。また、汎化の品質向上に寄与する辞書の更新についても実験的検当結果を報告する。, 一般社団法人 人工知能学会, 日本語 - 問題解決のための知識マネージメントシステムの研究(第2報) - タスクの種類に応じた知識の記述 -
吉岡 真治, 五十嵐 優, 社本 康広, 人工知能学会全国大会論文集, 3, 0, 93, 93, 2003年
本研究では、ユーザが持つ問題に対し、類似事例などを提示しながら、問題解決を支援する知識マネージメントシステムの研究を行う。本報では、問題解決のタスクの種類に関する分析と、その分析に応じて適切な知識の構造化手法について提案する。, 一般社団法人 人工知能学会, 日本語 - インバースマニュファクチャリングのためのアップグレーダブル設計(第6報):機能追加/削除によるアップグレード設計
八木 宏明, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治, 精密工学会学術講演会講演論文集, 2003, 0, 257, 257, 2003年
製品のアップグレード設計とは、モジュールを追加、交換することにより製品の機能をアップグレードし機能寿命の延命化を図るものであり、機能の陳腐化による廃棄行動を抑制可能である。本稿では、アップグレード時に機能の追加/削除を可能にするアップグレード製品設計の方法論を提案する。具体的には、対象製品の機能·挙動·構造の関係を操作することにより、機能の追加/削除が可能である、追加モジュールおよび世代間で共通のプラットフォームを決定する。, 公益社団法人 精密工学会 - インバースマニュファクチャリングのためのアップグレーダブル設計 (第7報):市場投入技術と消費者指向を考慮したアップグレード計画
松田 暁, 下村 芳樹, 吉岡 真治, 梅田 靖, 精密工学会学術講演会講演論文集, 2003, 0, 258, 258, 2003年
著者らは,製品の機能的な寿命の延長を実現するための方法であるアップグレード設計方法論の研究を行っている。本研究は、予測された市場の技術動向に対し追従可能であるよう,製品に施す機能的なアップグレードを計画し、その計画を最適に実現可能であるように製品を設計するための方法を与えることを目的とするものであり、製品のアップグレードを効果的に行うためには、製品アップグレードの計画段階でそれによる効果を把握できることが好ましい。本報では、市場に投入される技術の内容、タイミング、製品使用者の指向等に影響される不確実性を考慮した上で、消費者要求の将来予測を行い、それに基づいた製品ラインナップに要求される仕様を把握する方法について提案する。, 公益社団法人 精密工学会 - Universal Abduction Studioの開発(第1報):Universal Abduction Studioの基本構想
下村 芳樹, 坂井 宏充, 野間口 大, 吉岡 真治, 武田 英明, 冨山 哲男, 精密工学会学術講演会講演論文集, 2003, 0, 27, 27, 2003年
著者らは設計における創造性の理解とその計算機による支援を目的とする研究を行っており、その一環として統合的推論環境Universal Abduction Studioの開発に着手している。創造性の高い設計支援を実現する一つの鍵は、対象固有の領域知識のみでなく、異なる領域に属する知識を横断的に利用可能とすることであると考えられる。本研究では、異領域の知識を横断的に利用する推論形態としてのAbductionに着目し、これを統合的に実装することにより創造性の高い設計支援のための推論環境を提供するUniversal Abduction Studioの提案を行う。, 公益社団法人 精密工学会 - Universal Abduction Studioの開発(第2報):構造的アナロジー推論に基づく設計支援
坂井 宏充, 野間口 大, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2003, 0, 28, 28, 2003年
著者らは設計における創造性の理解とその計算機による支援を目的に研究を行っている。創造性の高い設計の支援を考える場合、対象固有の領域知識に留まらず、異なる領域に属する知識を横断的に利用可能とすることが必要である。本研究では、知識間の構造的な類似性を発見する枠組みと、これを創造性の高い設計支援に適用する手法を提案する。特に、知識間の類似性発見の手法について、例題よりその有効性を検証する。, 公益社団法人 精密工学会 - 問題解決のための知識マネージメントシステムの研究(第2報)タスクの種類に応じた知識の記述
吉岡 真治, 五十嵐 優, 社本 康広, 人工知能学会全国大会論文集, 17, 1, 3, 2003年
人工知能学会, 日本語 - Universal Abduction Studioの開発(第3報):高創造性設計支援のための知識表現
藤本 裕, 野間口 大, 下村 芳樹, 吉岡 真治, 武田 英明, 精密工学会学術講演会講演論文集, 2003, 0, 39, 39, 2003年
対象固有の領域知識を用いるだけでは、既存の設計解を改良することは可能であっても創造性の高い設計を支援することは困難である。即ち、創造性の高い設計を支援するためには、異なる領域に属する知識を関連づけることによる問題の再定義や、新しい知識を作成するための手段が必要である。本報では、前報で提案した知識間の類似性を発見する枠組とその評価結果に基づき、より高度な知識利用を実現するための知識表現の枠組みに対する要求仕様を明らかにするとともに、その具体的な実現方法に関して考察する。, 公益社団法人 精密工学会, 日本語 - Al in Design Webliography(Web 探訪)
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 18, 1, 101, 101, 2003年01月01日
社団法人人工知能学会, 日本語 - Research Index : 新しい形の電子図書館(Web探訪)
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 17, 5, 649, 650, 2002年09月01日
社団法人人工知能学会, 日本語 - 極大類比による文書群の組織化
原口 誠, 中野 卯虎, 吉岡 真治, 情報処理学会研究報告. NL,自然言語処理研究会報告, 150, 66, 99, 103, 2002年07月15日
類似した文書群に共通するイベント系列により文書群を組織化する可能性について論じる。そのために、文の格構造の汎化を要素としてもつ極大類比を導入し、汎化コスト条件を用いた極大類比の発見的検出手法を示す。あわせて、非類似文書とのネガティブマッチングにより、可能な類比を抑制する効率の良い方法も示す。意味処理の困難さに起因する問題点についても触れ、それに関する今後の計画も述べる。, 一般社団法人情報処理学会, 日本語 - 極大類比による文書群の組織化
原口 誠, 中野 卯虎, 吉岡 真治, 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション, 102, 200, 1, 5, 2002年07月09日
類似した文書群に共通するイベント系列により文書群を組織化する可能性について論じる。そのために、文の格構造の汎化を要素としてもつ極大類比を導入し、汎化コスト条件を用いた極大類比の発見的検出手法を示す。あわせて、非類似文書とのネガティブマッチングにより、可能な類比を抑制する効率の良い方法も示す。意味処理の困難さに起因する問題点についても触れ、それに関する今後の計画も述べる。, 一般社団法人電子情報通信学会, 日本語 - 適合的汎化に基づく情報検索システムの研究(第一報) : 検索語が持つ適合性判定への寄与度の利用
吉岡 真治, 原口 誠, 大久保 好章, 情報処理学会研究報告. データベース・システム研究会報告, 127, 41, 151, 158, 2002年05月21日
情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。この問題に対し、検索者の検索意図を推定し、検索者の補完を行う検索システムが提案されている。しかし、補完した結果は複雑であることが多く、検索者が補完結果自体を評価することが困難である。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案する。本報では、概念階層の汎化のレベルを決定するために、検索者により入力された検索語が持つ適合性判定への寄与度を考える。また、本システムの性能を向上させるためには、概念階層自体が目的に応じて再構成されることが必要であることについて述べ、目的指向の概念階層の修正の方法を提案する。, 一般社団法人情報処理学会, 日本語 - 適合的汎化に基づく情報検索システムの研究(第1報) -検索語が持つ適合性判定への寄与度の利用-
吉岡 真治, 原口 誠, 大久保 好章, 情報処理学会研究報告情報学基礎(FI), 2002, 41, 151, 158, 2002年05月21日
情報検索システムを利用する検索者にとって、適切なキーワードを選択することは必ずしも容易なことではない。この問題に対し、検索者の検索意図を推定し、検索者の補完を行う検索システムが提案されている。しかし、補完した結果は複雑であることが多く、検索者が補完結果自体を評価することが困難である。本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案する。本報では、概念階層の汎化のレベルを決定するために、検索者により入力された検索語が持つ適合性判定への寄与度を考える。また、本システムの性能を向上させるためには、概念階層自体が目的に応じて再構成されることが必要であることについて述べ、目的指向の概念階層の修正の方法を提案する。It is not easy for a user of Information Retrieval (IR) system to select appropriate keywords. Therefore, many IR systems have capability to modify keywords by estimating user's intent. However, since modified keywords are usually represented as complicated form, it is difficult to judge the appropriateness of them. In this research, we proposed a new IR system that uses adaptive generalization of keywords. When the system can selects appropriate generalization by estimating user's intent, the system can generate good keywords that have high readability and good retrieval performance. In this report, we proposed to use the contribution value of each keyword for relevance judgement to select appropriate generalization. In addition, we confirm general concept structure stored in a thesaurus is not sufficient for representing particular user's intent. Therefore, we proposed a purpose oriented method to modify concept structure., 日本語 - 語彙概念構造を利用した複合名詞内の係り関係の解析(<特集>システムLSIの設計技術と設計自動化)
竹内孔一, 内山清子, 吉岡真治, 影浦峡, 小山照夫, 情報処理学会論文誌, 43, 5, 1446, 1456, 2002年05月15日
本研究では,主辞がサ変名詞である複合名詞の語構成において,構成する単語間の係り関係を支配する語彙的性質に着目し,それに基づく複合名詞解析モデルの作成を試みる.主辞がサ変名詞の複合名詞内の係り関係の解析は,並列関係の場合を除くと,主辞であるサ変名詞の項関係なのか修飾なのかを同定することが解析の第1歩である.項関係とは名詞が動詞の目的語や主語といった関係であることを意味している.本論文では,この関係をとらえる方法として,語彙概念構造を利用した動詞の分類と,その構造を利用した名詞の分類に基づく複合名詞解析手法を提案する.情報処理関連の専門用語と新聞記事中の一般的な複合名詞に対してテスト的な実験を行った.その結果,平均で1231語の複合名詞対して約99.4%の複合名詞を正しく解析する結果を得た., 社団法人情報処理学会, 日本語 - 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(<特集>NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
吉岡 真治, 神門 典子, Masaharu Yoshioka, Noriko Kando, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 17, 3, 295, 295, 2002年05月01日
社団法人人工知能学会, 日本語 - AI Topics (AAAI)
吉岡 真治, 人工知能学会誌 = Journal of Japanese Society for Artificial Intelligence, 17, 3, 372, 373, 2002年05月01日
社団法人人工知能学会, 日本語 - 大規模テストコレクションNTCIR-2の構築 : 対話型追加検索と言語横断的プーリングの効果(<特集>情報の検索とテストコレクション)
栗山和子, 吉岡真治, 神門典子, 情報処理学会論文誌. データベース, 43, 2, 48, 59, 2002年03月15日
大規模テストコレクションNTCIR-2の正解文書リストは,NTCIR ワークショップ2において各参加者から提出された検索結果を用いて,プーリング法に基づいて作成された.本稿では,NTCIR-2の正解文書リストの作成過程において行われた,言語横断的プーリング,および対話型検索システムを用いた追加検索が,検索システムのNTCIR-2を用いた相対的評価にどのような影響を与えるかを考察する.また,プーリングに参加しなかったシステムを評価する場合に,プーリング法で作成したNTCIR-2が有効であるかどうか調べる.本研究では,NTCIR-2の正解文書リストと,NTCIR ワークショップ2の参加チームの提出結果を用いて評価実験を行った.まず,最終的な正解文書リスト Fと,Fから追加の対話型検索Iだけで見つかった文書を除いた正解文書リストF-Iを用いて、提出結果の評価を行った.次に,各サブタスクごとの提出結果からプーリングを行い,このサブタスクごとのプールを正解文書リストとして用いた場合の評価を行った.さらに,プーリングに参加しなかったシステムの評価をシミュレートするため,Fから同じシステムの提出結果の集合だけに含まれている正解文書Sを除いた正解文書リストF-Sを用いて,そのシステムの提出結果を評価した.いずれの場合でも,提出結果の平均精度の平均による順位付けを行い,相対的評価とした.結果と..., 社団法人情報処理学会, 日本語 - インパース・マニュファクチャリングのためのアップグレーダブル設計(第5報):不確実性に対応した設計支援ツールの開発
梅森 嘉匡, 八木 宏明, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治, 精密工学会大会学術講演会講演論文集, 2002, 1, 138, 138, 2002年03月01日
日本語 - 文書情報と形式化された知識を融合する知識マネージメントの研究 (第1報)-文書情報と形式的知識の融合-
吉岡真治, 2002年度人工知能学会全国大会講演論文集, 2002年 - 特集「NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ」にあたって(<特集>NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
吉岡 真治, 神門 典子, 人工知能, 17, 3, 295, 295, 2002年
一般社団法人 人工知能学会, 日本語 - 参加者から見たNTCIR(<特集>NTCIR : 情報アクセスに関わるテキスト処理技術の評価ワークショップ)
小川 泰嗣, 佐々木 裕, 増山 繁, 村田 真樹, 吉岡 真治, 人工知能, 17, 3, 306, 311, 2002年
一般社団法人 人工知能学会, 日本語 - 1201 インバースマニュファクチャリングのためのアップグレード設計支援システムの開発
石上 佳照, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治, 設計工学・システム部門講演会講演論文集, 2002, 0, 56, 59, 2002年
Upgrade design is one of the usefull approaches to realize inverse manufacturing because upgrade design can extend product lives and reduce consumption volume of resources and energy usage. However, difficulty of upgrade design resides within prediction of future trend such as technological trends and market trends. This papar propose a design method for upgradable products, and prototype design support tool which can be adapted changes of user requirement and market trend. Using design example of vacuume cleaner, this papar demonstrates that this support tools is effective for designing upgradable products., 一般社団法人 日本機械学会, 日本語 - 3203 人工物工学の展開(第 18 報) : Universal Abduction Studio の提案
坂井 宏充, 野間口 大, 吉岡 真治, 武田 英明, 下村 芳樹, 冨山 哲男, 設計工学・システム部門講演会講演論文集, 2002, 0, 410, 411, 2002年
Although design support systems have been well developed in geometric and detail design areas, they are still not successful in conceptual or creative design domain. In our opinion, the main difficulty is knowledge and its operation that play a crucial role in conceptual design. In this paper, we propose "Universal Abduction Studio" that is a new approach to support designers by computers, and discuss technologies to realize it., 一般社団法人 日本機械学会, 日本語 - 問題解決のための知識マネージメントシステムの研究(第1報):- 文書情報と形式的知識の融合 -
吉岡 真治, 五十嵐 優, 社本 康広, 人工知能学会全国大会論文集, 2, 0, 142, 142, 2002年
一般社団法人 人工知能学会 - 問題解決のための知識マネージメントシステムの研究(第1報)文書情報と形式的知識の融合
吉岡 真治, 五十嵐 優, 社本 康広, 人工知能学会全国大会論文集, 16, 1, 4, 2002年
人工知能学会, 日本語 - 設計知識管理のためのCADアーキテクチャーの提案
野間口 大, 吉岡 真治, 冨山 哲男, 人工知能学会論文誌, 17, 17, 104, 113, 2002年
In this paper, we propose a fundamental idea of a new CAD mechanism to facilitate design knowledge management. This mechanism encourages a designer to externalise his/her knowledge during a design process and facilitates sharing and reuse of such externalised design knowledge in later stages. We also describe the implementation of this idea called DDMS (Design Documentation Management System). DDMS works as a front end to KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the features of DDMS., 一般社団法人 人工知能学会, 日本語 - 大規模テストコレクションNTCIR-2の構築 : 言語横断的プーリングの評価への影響
栗山 和子, 吉岡 真治, 神門 典子, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 63, 74, 9, 16, 2001年07月24日
大規模テストコレクションNTCIR-2の構築において、正解文書リストは、プーリング法に基づいて作成された。本稿では、NTCIR-2の正解文書リストの作成過程で行なった言語横断的プーリングおよび対話型検索システムを用いた追加検索が、NTCIR-2を使用した検索システムの評価に与える影響をついて考察する。本研究では、NTCIR-2の正解文書リストと、NTCIRワークショップ2の参加チームの提出結果を用いて評価実験を行なった。まず、NTCIR-2の最終的な正解文書リストFと、Fから追加の対話型検索Iだけで見つかった文書を除いたリストF-Iを用いて、提出結果の評価を行なった。次に、各サブタスクごとの提出結果からのプーリングを行ない、このサブタスクごとのプールを正解文書リストとして評価を行なった。結果として、いずれの文書リストを正解文書リストとして提出結果の評価を行なっても、提出結果の相対的な順位はほとんど変化せず、プーリング法に基づいて作成したテストコレクションの信頼性を確かめることができた。, 一般社団法人情報処理学会, 日本語 - 多段階レレバンス判定による評価 : 平均可能な単一指標の検討
神門 典子, 栗山 和子, 吉岡 真治, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 63, 74, 105, 112, 2001年07月24日
本稿では、多段階レレバンス判定に適応できる新しい情報検索システムの検索有効性評価指標を提案する。検索された文書の検索質問への適合性(レレバンス)判定は、検索有効性評価のもっとも基本的な要素の1つである。検索では、通常、より適合性の高い文書がより早く(より上位のランクで)検索されることが望ましい。しかしながら, 従来、検索有効性を示す精度と再現率は、「適合」「不適合」の二値判定に基づいて算出され、「より適合性が高い」という側面を評価できなかった。テストコレクションを用いる情報検索システムの実験室型評価では、多数の検索を行い、それぞれの評価値を平均することで安定した評価が可能である。そこで、本稿では、既存の検索有効性指標の特性を検討し、それを踏まえ、扱いやすい単一の平均可能な指標として、重み付きR精度と重み付き平均精度を提案し、「高適合」、「適合」、「部分的適合」、「不適合」の4段階レレバンス判定を採用した第2回NTCIRワークショップの日本語検索タスクの提出結果を評価した例をしめす。最後に、多段階レレバンス判定による評価と、利用者指向の検索システム評価との関連にも言及する。, 一般社団法人情報処理学会, 日本語 - The effect of cross-lingual pooling on evaluation
Kuriyama,K, Yoshioka, M, Kando, N, Proceedings of the Second NTCIR Workshop on Research in Chinese & Japanese Text Retrieval and Text Summarization., Tokyo, Japan, May 2000-March 2001, National Institute of Informatics, 297, 310, 2001年07月
英語, 書評論文,書評,文献紹介等 - Overview of Japanese and English Information Retrieval Tasks (JEIR) at the Second NTCIR Workshop
Kando, N, Kuriyama, K, Yoshioka, M, Proceedings of the Second NTCIR Workshop on Research in Chinese & Japanese Text Retrieval and Text Summarization, Tokyo, Japan, May 2000-March 2001, National Institute of Informatics, 73, 96, 2001年07月
英語, 書評論文,書評,文献紹介等 - Analysis of the usage of Japanese segmented texts in NTCIR Workshop 2
Yoshioka, M, Kuriyama, K, Kando, N, Proceedings of the Second NTCIR Workshop on Research in Chinese & Japanese Text Retrieval and Text Summarization., Tokyo, Japan, May 2000-March 2001, National Institute of Informatics, 291, 296, 2001年07月
英語, 書評論文,書評,文献紹介等 - インバース・マニュファクチャリングのためのアップグレーダブル設計 (第4報) アップグレーダブル設計におけるプラニング戦略
下村芳樹, 吉岡真治, さい剛民, 梅森嘉匡, 梅田靖, 精密工学会大会学術講演会講演論文集, 2001, 365, 2001年03月05日
日本語 - 人と情報システムとのシンビオシスのための情報検索および情報活用支援に関する研究 -- Web文書検索を中心として--
栗山和子, 吉岡真治, 江口浩二, 岸田和明, 神門典子, 影浦峡, 高野明彦, 大山敬三, 安達淳, COEプロジェクト平成12年度報告書『シンビオティック情報システムへの概念形成と実現技術』, 国立情報学研究所,2001, 47, 54, 2001年03月
日本語, 書評論文,書評,文献紹介等 - 2307 設計知識に注目した設計の推論モデルの提案(第 3 報) : 設計行為に関する知識を記述するシンセシス言語の提案
吉岡 真治, 武田 英明, 鷲尾 隆, 冨山 哲男, 設計工学・システム部門講演会講演論文集, 2001, 0, 281, 284, 2001年
Since design knowledge plays a crucial role in design process, we are conducting research on design reasoning model that takes notice of design knowledge. To make a design reasoning model, we have already proposed a reasoning framework of design and analyzed basic operations for the framework. However, since these operations are just fragments of whole design process, it is necessary to describe design operational knowledge that can control the entire reasoning operations by constructing the sequence of these fragments. So, in this paper, we propose a synthesis language for describing design operational knowledge., 一般社団法人 日本機械学会, 日本語 - 2308 設計知識に注目した設計の推論モデルの提案(第 4 報) : 設計の推論モデルの計算機上への実装と検証
野間口 大, 妻屋 彰, 吉岡 真治, 鷲尾 隆, 武田 英明, 村上 存, 冨山 哲男, 設計工学・システム部門講演会講演論文集, 2001, 0, 285, 288, 2001年
Since design knowledge plays a crucial role in design process, we are conducting research on design reasoning model that takes notice of design knowledge. To make a design reasoning model, we have already proposed a reasoning framework of design and analyzed basic operations for the framework, and then propose a synthesis language for describing design operational knowledge. In this paper, we propose our implementation of this model, and verify it to compare design processes replayed in the system with ones of actual design sessions., 一般社団法人 日本機械学会, 日本語 - 2309 設計知識に注目した設計の推論モデルの提案(第 5 報) : 異なる設計過程のモデルとの比較
妻屋 彰, 野間口 大, 吉岡 真治, 武田 英明, 村上 存, 冨山 哲男, 設計工学・システム部門講演会講演論文集, 2001, 0, 289, 292, 2001年
In engineering design research, numerous design process models have already been proposed. For constructing model of synthesis, it is very important to know the position of the model among them. This paper reports results of comparison of some design process models with the synthesis oriented thought process model. We use a reference model as an example of design, compare it with some existing design process models, and the results of this analysis are described., 一般社団法人 日本機械学会, 日本語 - 206 設計知識管理のためのCADアーキテクチャーの提案(設計知識管理(2))
野間口 大, 吉岡 真治, 冨山 哲男, 設計シンポジウム講演論文集, 2001, 19, 109, 116, 2001年
In this paper, we propose a fundamental idea of a new CAD architecture to facilitate design knowledge management. This architecture is based on knowledge-based design environment for encouraging the designer to externalize his/her knowledge. We also discuss the implementation of this idea. DDMS (Design Documentation Management System) works as a front end for KIEF (Knowledge Intensive Engineering Framework), which we have been developing. We also illustrate an example of machining tool design to demonstrate the system's features., "日本機械学会, 精密工学会", 日本語 - 2314 人工物工学研究の展開(第15報) : 設計者の思考パターンの発見による知識獲得(OS05-2/人工物工学研究の展開)(OS05/人工物工学)
坂井 宏充, 野間口 大, 吉岡 真治, 下村 芳樹, 冨山 哲男, 設計工学・システム部門講演会講演論文集, 2001, 0, 204, 206, 2001年
In engineering activities, management of designers' knowledge is becoming crucial to share and reuse it efficiently. Toward this issue, we are studying a methodology to capture the designer's thought process, and to semi-automatically arrange it into a refined document, which addresses a particular objective with particular thought patterns. The key issues of this methodology are to acquire the thought patterns and to define relations among them. This paper reports our algorithm to acquire thought patterns from a record of designer's thought processes and any other types of documents including patent documents and academic papers. We employ a knowledge discovery approach which is recently discussed in data mining research., 一般社団法人 日本機械学会, 日本語 - 3104 将来の不確実性に対応したアップグレード設計方法論(OS02/インバースマニュファクチャリング)
梅森 嘉匡, 近藤 伸亮, 梅田 靖, 下村 芳樹, 吉岡 真治, 設計工学・システム部門講演会講演論文集, 2001, 0, 269, 272, 2001年
Conventional products tend to be thrown away because of functional obsoleteness before reaching the end of physical life of the products. This is one of the main causes of the mass disposal problem. In order to solve this problem, this paper proposes a design methodology for upgradable products. Especially, this paper discusses a method dealing with uncertainty of long-term planning in the design methodology. The proposed method deals with uncertainty as ranges of parameter values, and derives a design solution that realizes required upgrades, while adapting to estimated uncertainty. This method makes a design object robust and tolerant against the uncertainty and, therefore, makes design for upgradability more feasible., 一般社団法人 日本機械学会, 日本語 - 3305 文書情報と形式化された知識を融合する知識マネージメントシステムの研究(G01-2/一般(2))(G01/一般)
吉岡 真治, 社本 康広, 設計工学・システム部門講演会講演論文集, 2001, 0, 321, 324, 2001年
In engineering activities, engineers solve various kinds of problems. Most of these problems are routine problems that are easy to formalize and formalized knowledge is useful for these problems. On the other hand, there are complicated problems that is difficult to formalize all of the problem solving process. One of the useful information to solve such complicated problems is result of the similar problem solving process. In addition, later in such complicated problem solving process, most of the decomposed subproblems are able to handle as routine problems. In this research, we decide to use formalized knowledge and document information that represents the history of problem solving processes to support to solve both types of the problem. For that purpose, we propose a new knowledge management system that supports a user to solve the problem through document processing. In this support process, the system retrieves related documents for user's problems by using formalized knowledge and information retrieval techniques. After retrieving related documents, he/she modifies them to fit his/her problems. Modified information is associated with the formalized knowledge and stored as documents for future reuse., 一般社団法人 日本機械学会, 日本語 - 大規模テストコレクションNTCIR-1とNTCIR-2 : レコードから見た違い
栗山 和子, 吉岡 真治, 神門 典子, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 60, 91, 9, 16, 2000年09月27日
本稿では、大規模テストコレクションNTCIR-1とNTCIR-2および、NTCIRワークショップ2について紹介し、NTCIR-1とNTCIR-2の文書レコードから見た違いについて述べる。具体的には、レコードの長さ、その分布、異なり語数、その頻度などから、NTCIR-1と2の違いについて考察する。, 一般社団法人情報処理学会, 日本語 - 大規模テストコレクション NTCIR-1とNTCIR-2--レコードから見た違い (情報処理学会情報学基礎研究会(FI)第60回発表論文(図書館情報大学.2000年9月27日))
栗山 和子, 吉岡 真治, 神門 典子, ディジタル図書館, 18, 18, 57, 64, 2000年09月
ディジタル図書館編集委員会, 日本語 - 〈発表論文〉大規模テキストコレクションNTCIR-1とNTCIR-2 : レコードから見た違い(情報処理学会 情報学基礎研究会(FI)第60回)
栗山和子, 吉岡真治, 神門典子, Kuriyama kazuko, Yoshioka Masaharu, Kando Noriko, クリヤマカズコ, ヨシオカマサハル, カンドノリコ, ディジタル図書館, 18, 57, 64, 2000年09月
ディジタル図書館編集委員会 - 設計活動を表現する語彙に関する研究(第3報) : 情報操作の視点から見た語彙の整理と意味付け
吉岡 真治, 武田 英明, 妻屋 彰, 村上 存, 冨山 哲男, 精密工学会大会学術講演会講演論文集, 2000, 2, 259, 259, 2000年09月01日
日本語 - 設計事例分析による設計過程モデルの比較(第2報) : 設計過程の情報モデルの提案
野間口 大, 妻屋 彰, 吉岡 真治, 武田 英明, 村上 存, 冨山 哲男, 精密工学会大会学術講演会講演論文集, 2000, 2, 260, 260, 2000年09月01日
日本語 - シンセシスの推論フレームワークに関する研究(第1報) : シンセシスのモデル化
武田 英明, 吉岡 真治, 冨山 哲男, 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI, 14, 0, 464, 467, 2000年07月03日
人工知能学会, 日本語 - シンセシスの推論フレームワークに関する研究(第2報) : モデルベース・アブダクション
吉岡 真治, 武田 英明, 冨山 哲男, 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI, 14, 0, 468, 471, 2000年07月03日
人工知能学会, 日本語 - 語彙の制約を考慮した複合語解析モデルの構築
竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 57, 29, 71, 78, 2000年03月21日
我々は制約に基づく複合語解析モデルの構築を目指している.2単語からなる動詞を主辞にもつ複合語(動詞由来複合語)は前項の単語が主辞(後項)のサ変動詞に対して修飾的な働きを示す付加詞なのか, 主辞の内項(argument)に当たるのかを解析することが複合語の解析につながる.我々は文法的枠組として項構造, 語彙概念構造を用いてサ変動詞を分類した.しかし, 複合語の解析に当たって, 前項の単語(名詞, 形容動詞, サ変動詞)と主辞(サ変動詞)との関係が修飾か内項かの関係をほぼ決定するので, 名詞に対する分類が必要である.そこで, 本論文では, サ変動詞の項構造, 語彙概念構造を基にして, 名詞の分類を行ない, これを用いて複合語解析モデルの構築を目指す.分類には, 生成語彙の特質構造も利用した.分類をもとに制約を仮定し, 情報処理用語辞典から取り出した2単語からなる動詞由来複合語について入手による解析実験を行なった.その結果103語の複合語のうち, 92個(89%)の複合語を制約で解析することができた.この結果を受けて, 現段階でのモデルの限界について議論する., 一般社団法人情報処理学会, 日本語 - 語彙の制約を考慮した複合語解析モデルの構築
竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫, 情報処理学会研究報告. 自然言語処理研究会報告, 2000, 29, 71, 78, 2000年03月21日
我々は制約に基づく複合語解析モデルの構築を目指している.2単語からなる動詞を主辞にもつ複合語(動詞由来複合語)は前項の単語が主辞(後項)のサ変動詞に対して修飾的な働きを示す付加詞なのか, 主辞の内項(argument)に当たるのかを解析することが複合語の解析につながる.我々は文法的枠組として項構造, 語彙概念構造を用いてサ変動詞を分類した.しかし, 複合語の解析に当たって, 前項の単語(名詞, 形容動詞, サ変動詞)と主辞(サ変動詞)との関係が修飾か内項かの関係をほぼ決定するので, 名詞に対する分類が必要である.そこで, 本論文では, サ変動詞の項構造, 語彙概念構造を基にして, 名詞の分類を行ない, これを用いて複合語解析モデルの構築を目指す.分類には, 生成語彙の特質構造も利用した.分類をもとに制約を仮定し, 情報処理用語辞典から取り出した2単語からなる動詞由来複合語について入手による解析実験を行なった.その結果103語の複合語のうち, 92個(89%)の複合語を制約で解析することができた.この結果を受けて, 現段階でのモデルの限界について議論する., 一般社団法人情報処理学会, 日本語 - 文法的制約を用いた複合語解析モデルの作成 (学街情報分野)
竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫, 学術情報センター紀要, 12, 12, 7, 15, 2000年03月
複合語内の語構成を解析する手法として,従来より単語間の共起頻度を利用するモデルが提案されている.しかし,複合語内の語構成は文法的かつ意味的な制約が存在するために,単純な共起による解析モデルには限界がある.最近,形態論や統語論で語のレベル,項構造,語彙概念構造という文法的要素が提案されており,一定の成果が上がっている.本論文では,これらの文法的知識を利用することで,複合語の語構成における制約がどの程度記述できるかを明らかにする.解析の対象として,複合語はサ変名詞を主辞に含む2単語からなる情報処理用語を中心的に取り上げた.考察の結果から,1)2単語間の係関係は修飾かサ変名詞の項の2種の関係に整理できること,2)サ変名詞の項構造が係関係を決定すること,3)文脈により複合語の語構成が変化することが明らかとなった.これらの結果をもとに,複合語解析モデル作成のための考察を行なう., 国立情報学研究所, 日本語 - 設計活動を表現する語彙に関する研究(第1報) : 語彙の階層的整理
吉岡 真治, 妻屋 彰, 冨山 哲男, 武田 英明, 精密工学会大会学術講演会講演論文集, 2000, 1, 18, 18, 2000年03月01日
精密工学会, 日本語 - 設計活動を表現する語彙に関する研究(第2報) : シンセシスのフレームワークとの対応
武田 英明, 吉岡 真治, 妻屋 彰, 冨山 哲男, 精密工学会大会学術講演会講演論文集, 2000, 1, 19, 19, 2000年03月01日
精密工学会, 日本語 - 設計事例分析による設計過程モデルの比較(第1報) : 設計事例記録の整理
妻屋 彰, 野間口 大, 吉岡 真治, 武田 英明, 村上 存, 冨山 哲男, 精密工学会大会学術講演会講演論文集, 2000, 1, 20, 20, 2000年03月01日
日本語 - インバース・マニュファクチャリングのためのアップグレーダブル設計(第3報) : 支援システムの試作
今川 晴紀, 下村 芳樹, 吉岡 真治, 梅田 靖, 精密工学会大会学術講演会講演論文集, 2000, 1, 96, 96, 2000年03月01日
日本語 - インバース・マニュファクチャリングのためのアップグレーダブル設計 (第2報) 対象表現モデルと機能修飾子を用いたアップグレード機能の同定
下村芳樹, 今川晴紀, 吉岡真治, 梅田靖, 日本機械学会設計工学・システム部門講演会講演論文集, 9th, 501, 504, 1999年11月19日
日本語 - 語基の詳細な特徴を考慮した複合語解析モデル
竹内 孔一, 内山 清子, 吉岡 真治, 影浦 峡, 小山 照夫, 電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション, 99, 387, 7, 14, 1999年10月25日
複合語を解析するモデルを作成するために,複合語を構成する語基に対してどのような背景知識を用意すればよいのであろうか.本論文では,形態論や統語論で用いられている,語のレベル,項構造,語彙概念構造を用いて,サ変名詞を含む2語基からなる専門用語を中心に解析を人手で行なった.解析とは2語基間の係り関係の把握を意味している.この解析の結果,起こり得ない語構成の説明や,複合語自体の品詞が変わる現象を一部説明することができた.今回利用した要素はサ変名詞の動詞的要素を記述するために用意した.本文中ではサ変名詞中心に複合語を解析した場合に,名詞に対してどのような記述をすれば良いかも考察して行く., 一般社団法人電子情報通信学会, 日本語 - 設計文書作成管理システムの研究
吉岡 真治, 野間口 大, 冨山 哲男, 情報処理学会研究報告, 99, 88, 63, 68, 1999年10月21日
設計者は一つのものを設計する過程において、様々な情報や知識を利用して、設計解の選択や設計解の評価と言った判断を下していく。この様な判断の過程で生み出される情報は、その設計解に至った理由を理解するためだけではなく、設計者の持つ知識が反映された再利用可能な有益な情報であると考えられる。そのため、様々な企業で、設計過程の情報を設計文書として蓄積する事が行われている。しかし、実際の設計文書の作成は、設計作業が終了してから説明のために作成されることが多く、情報の欠落などが起りやすい。また、これらの文書は紙や光ディスクなどで蓄積されているが、あまり有効な再利用の枠組みが用いられていない。そこで、我々は、この設計文書を管理する枠組みとして、設計を進めながら同時に設計文書の作成を行うことができ、設計の文脈に応じた設計文書の検索と再利用が可能である設計文書作成管理システムを提案している。本報では、この設計文書作成管理システムの日本語化と全文検索技術の応用について述べる。, 一般社団法人情報処理学会, 日本語 - 複合名詞の語構成要素間の結合関係に関する考察 : 文法的特性に基づく品詞相当カテゴリーの評価
内山 清子, 竹内 孔一, 吉岡 真治, 影浦 峡, 小山 照夫, 電子情報通信学会技術研究報告. TL, 思考と言語, 99, 237, 7, 12, 1999年07月26日
情報を検索するためのキーワードは専門分野の複合名詞が多く用いられる。複合名詞の内部構造を解析することにより、複合語生成のメカニズムを明らかにすることができる。従来、複合名詞を構成している語基の意味的関係を中心に解析が行われてきたが、形態的、文法的特性も重要な役割を果たしていると考えられる。本研究では、複合語を解析する時に従来の品詞では扱えなかった部分 (特に名詞) に関する文法的特性について、格助詞の接続パターンによる独自の品詞相当カテゴリーを設定した。そして、複合語を構成している語基間の係り受け関係や結合関係を品詞相当カテゴリーによる文法的特性を用いて考察する。, 一般社団法人電子情報通信学会, 日本語 - タイトルと要旨の情報に基づくキーワードの役割分類の研究
吉岡 真治, 学術情報センター紀要, 11, 11, 27, 31, 1999年03月
論文には、解説論文、新しい技術を提案している論文、既存の技術を適切に応用した結果を報告した論文など様々なタイプの論文が有り、検索要求によって、適切なタイプの論文が異なると考えられる。よって、本研究では、様々なタイプの論文を区別するために、著者が付けたキーワードをその役割毎に分類するための方法論の提案を目標とする。そのために、本研究では、キーワードの役割はキーワードと共に用いられる動詞に強く関係すると考え、文章中における動詞とキーワードの関係の情報を用いた分類方法の提案を目標とする。本稿では、この分類方法を提案するにあたり、実際の論文のデータに基づいて、キーワードの役割を特徴づけるための動詞についての考察を行い、その結果に基づいて実際にキーワードの役割分類の実験を行ったので、それについて報告する。, 国立情報学研究所, 日本語 - 専門分野における複合名詞の語構成要素の品詞相当カテゴリーに関する一考察
内山 清子, 竹内 孔一, 吉岡 真治, 影浦 峡, 小山 照夫, 学術情報センター紀要, 11, 11, 49, 57, 1999年03月
専門分野における複合名詞を分析する時に、複合名詞を構成している語構成要素の情報が必要となってくる。本研究では、語構成要素の文法情報だけでどこまで複合名詞の性質を分析することができるかどうかを見きわめるために、語構成要素を文法情報である品詞相当カテゴリーに分類するための検討を行った。語構成要素においては、従来の文/単語関係で定義された品詞カテゴリーをそのまま適用することは難しい。そこで本研究では、従来の品詞カテゴリーを参照しつつ、新たに語構成用の品詞相当カテゴリーとその定義を設定することを試みた。, 国立情報学研究所, 日本語 - 専門用語抽出・解析処理を考慮したコーパスの作成
吉岡 真治, 岡田 真穂, 影浦 峡, 小山 照夫, 情報処理学会研究報告. FI,.情報学基礎研究会報告, 53, 20, 41, 48, 1999年03月01日
学術情報センター(NACSIS)では、NACSISテストコレクションの一環として、専門用語抽出・解析処理を特に考慮したNACSISコーパスを作成している。このコーパスでは、専門用語に関する処理の中心である語彙的処理を考慮する必要があり、語彙単位の明確化が重要な課題となる。そこで、本稿では、これらの問題に対応するためのNACSISコーパスの設計指針について述べる。さらに、本コーパスの作成状況と、その公開に関する状況について述べる。, 一般社団法人情報処理学会, 日本語 - オントロジーを用いた統合的設計支援環境の実現 (「オントロジーの基礎と応用」)
関谷 貴之, 吉岡 真治, 冨山 哲男, 人工知能, 14, 6, 1051, 1060, 1999年During design, a designer uses various computational tools, such as a geometric modeling system, analysis tools, and databases. To support these design processes, a system that can integrate such computational tools is required. For this purpose, we have been developing the Knowledge Intensive Engineering Framework (KIEF) system. KIEF enables the designer to build, evaluate, and modify design models on the system by providing him/her with a wide variety of engineering knowledge. A common ontology plays an important role in integrating tools and representing engineering knowledge. This paper describes the structure of the ontology in KIEF, and how it is used in a modeling processes on KIEF.
, 一般社団法人 人工知能学会, 日本語 - 知識集約型工学の建設設計への応用(<特集>学術情報分野)
吉岡 真治, 学術情報センター紀要, 10, 0, 73, 79, 1998年03月
近年の資源の有限性に関する問題や環境問題などのために、製造業に携わる人々は、各々が作る製品をより多くの様々な観点から評価する事が求められている。これらの問題に対応するために、我々は、製品のライフサイクル(設計・生産・保守・リサイクルなど)に関連する情報や必要な知識を柔軟かつ統合的に利用可能とする知識集約型工学(Knowledge Intensive Engineering)を提案しており、その計算機上へ実現したシステムであるKnowledge Intensive Engineering Framework(KIEF)システムを作成している。本論文では、まず、知識集約型工学およびKIEFシステムについて述べる。さらに、このKIEFシステムの有効性を検討するために本システムの建築設計への応用を試みる。そのために、建築設計に関する知識をどの様に本システム上の知識として表現できるかについて考察する。最後に、現在KIEFシステム上に構築中の知識ベースについて述べ、KIEFシステムの有効性について議論する。, 国立情報学研究所, 日本語 - 設計支援のための統合モデリング環境の研究 : プラガブル・メタモデル機構の提案
吉岡 真治, 冨山 哲男, 人工知能, 13, 2, 312, 319, 1998年In this study, we propose a framework of an integrated modeling environment for design. Since a mechanical engineering design process requires various kinds of design object models, such as a geometric model, a kinematic model, and a finite element model, this environment should maintain consistency among these models. Furthermore, commercial design tools are practically used in design processes, and these must be integrated as well. For dealing with multiple design object models, we have formalized a concept called a metamodel. A metamodel is a model which represents relationships among concepts used in various design object models. This paper proposes a framework of the pluggable metamodel mechanism that allows to plug in existing design tools, to support a modeling on it, and to maintain consistency among them. We describe a prototype system and illustrate an example of ball screw design.
, 一般社団法人 人工知能学会, 日本語 - Supporting conceptual design based on the function-behavior-state modeler
Y Umeda, M Ishii, M Yoshioka, Y Shimomura, T Tomiyama, AI EDAM-ARTIFICIAL INTELLIGENCE FOR ENGINEERING DESIGN ANALYSIS AND MANUFACTURING, 10, 4, 275, 288, 1996年09月
The relative significance of conceptual design to basic design or detail design is widely recognized, due to its influential roles in determining the product's fundamental features and development costs. Although there are some general methodologies dealing with functions in design, virtually no commercial CAD systems can support functional design, in particular so-called synthetic phase of design. Supporting the synthetic phase of conceptual design is one of the crucial issues of CAD systems with function modeling capabilities. In this paper, we propose a computer tool called a Function-Behavior-State (FBS) Modeler to support functional design not only in the analytical phase but also in the synthetic phase. To do so, the functional decomposition knowledge and physical features in the knowledge base of the modeler, and a subsystem Qualitative Process Abduction System (QPAS) play crucial roles. Modeling scheme of function in relation with behavior and structure and design process for conceptual design in the FBS Modeler are described. The advantages of the FBS Modeler are demonstrated by presenting two examples; namely, an experiment in which designers used this tool and the design of functionally redundant machines, which is a new design methodology for highly reliable machines, as its application., CAMBRIDGE UNIV PRESS, 英語 - 設計知識操作論
吉岡真治, 第14回設計シンポジウム講演論文集, 40, 47, 1996年 - 知識集約型のエンジニアリング環境の構築(第1報) -基本構成-
石井 理貴, 関谷 貴之, 吉岡 真治, 冨山 哲男, 精密工学会大会学術講演会講演論文集, 1995, 2, 9, 10, 1995年09月01日
日本語 - 複数の設計対象モデルを扱う設計過程モデル
吉岡 真治, 中村 雅彦, 冨山 哲男, 吉川 弘之, 日本機械学会論文集C編, 61, 581, 330, 337, 1995年
An intelligent CAD system aims at serving a designer as an intelligent, integrated design environment. For building such a system, development of a large scale knowledge base is necessary. To do so, design knowledge must be systematically formalized, made computable, and organized. Design knowledge has two categories ; i.e., design object knowledge and design process knowledge. In our previous reports, we have formalized a computable design process model to represent design process knowledge and the concept of a metamodel dealing with multiple design object models. This paper proposes a framework to achieve a harmonized combination of these two. In this framework, the computable design process model navigates the metamodel mechanism to generate and modify models of the design object. We describe a prototype system and illustrate an example of ship design., 一般社団法人 日本機械学会, 日本語 - 設計支援のための統合モデリング環境の研究(第1報) : プラガブル・メタモデル機構の提案
吉岡 真治, 石井 理貴, 冨山 哲男, 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI, 8, 0, 335, 338, 1994年06月20日
日本語 - 設計支援のための統合モデリング環境の研究(第2報) : パワーの伝達に関するモデルの組み込み
石井 理貴, 吉岡 真治, 冨山 哲男, 人工知能学会全国大会論文集 = Proceedings of the Annual Conference of JSAI, 8, 0, 339, 342, 1994年06月20日
日本語 - 設計知識表現のためのメタモデルの研究(第12報)
吉岡真治, 1994年度精密工学会春季大会講演論文集, 233, 234, 1994年 - メタモデル機構による設計対象モデリング支援
吉岡真治, 石井理貴, 桐山孝司, 冨山哲男, 人工知能学会知識ベースシステム研究会資料, 26th, 1993年
書籍等出版物
講演・口頭発表等
- 知識工学者のための Wikipedia カテゴリの分析とその活用
吉岡真治
人工知能学会 第110回人工知能基本問題研究会, 2019年09月24日, 口頭発表(招待・特別)
[招待講演] - Knowledge exploratory project for nanocrystal device development
Masaharu YOSHIOKA
ISMAC 2016 2016 International Symposium on Multimedia and Communication Technology, 2016年09月02日, 英語, 口頭発表(基調)
[招待講演], [国際会議] - Supporting design and engineering by physical concept ontologies
吉岡真治
The Tenth International Symposium on Tools and Methods of Competitive Engineering (TMCE 2014), 2014年05月22日, 英語, シンポジウム・ワークショップパネル(指名)
[招待講演], [国際会議]
担当経験のある科目_授業
共同研究・競争的資金等の研究課題
- Wikipediaの編集方針を考慮した大規模知識源の構築とその活用
科学研究費助成事業
2024年04月01日 - 2027年03月31日
吉岡 真治, 武田 英明, 大久保 好章
日本学術振興会, 基盤研究(B), 北海道大学, 24K03042 - 論文からの化学反応プロセス情報の自動抽出とその活用
科学研究費助成事業
2023年06月30日 - 2025年03月31日
吉岡 真治, 原 真二郎, 長田 裕也
日本学術振興会, 挑戦的研究(萌芽), 北海道大学, 23K18500 - 論文内の記述と各種科学技術DBを連携させる特定研究グループ向け論文DBの研究
科学研究費助成事業 挑戦的研究(萌芽)
2021年07月09日 - 2023年03月31日
吉岡 真治
本研究では、特定の分野に興味を持つ研究者が収集する関係分野の論文を対象としたデータベースに基づいて、専門用語抽出などを行うことにより、用語間の共起関係に基づく分析や、時系列を考慮した研究動向分析を行うデータベースを基礎として、化学物質データベースなどのさまざまな科学技術データベースと連携させることにより、分野の研究者の研究活動を支援するシステムの構築を目指している。本年度は、これまでに作成した論文・図表データベースを様々な科学技術データベースと連携させるための手法について検討すると共に、その機能をこれまでに作成した論文・図表データベースに実装した。本データベースでは、PDFやRSS(Rich Site Summary:論文誌などが論文を発行する際に、abstractなどのメタデータを含む情報を配信する仕組み)を対象として、対象データの収集を行う。
本データベースでは、収集した各論文および、論文中に含まれる図表に対して、本文やキャプションから分類済みの用語抽出を行い、その出現頻度などをメタデータとして付与している。このメタデータを用いた検索を行うことにより、材料としてAを使っている論文(図表)で、利用されることが多いパラメータといった検索が可能となる。また、検索結果を、抽出した専門用語をハイライトすると共に、外部データベースへのリンクが埋め込まれた形で表示することで、科学技術データベースとの連携を実現している。また、論文からの情報抽出の研究として、論文からの化学反応情報の抽出に関する研究を進めると共に、化学反応データベースであるReaxysとの対応関係についての調査を行った。
日本学術振興会, 挑戦的研究(萌芽), 北海道大学, 21K19814 - 解説型ウェブページの分かり易さ・見易さの自動評定とそれを用いたページ推薦システム
科学研究費助成事業 基盤研究(B)
2019年04月01日 - 2022年03月31日
宇津呂 武仁, 吉岡 真治, 乾 孝司, 亀田 能成
本研究では,特定の物事,概念,出来事,手順等の解説を掲載し,その内容を分かり易く伝える「解説型ウェブページ」において,特に,図解等の視覚効果を多く含む(i)理数系学術用語解説,および,(ii)手順やノウハウの解説,の分かり易さと見易さの因子を特定する.そして,「解説型ウェブページ」の分かり易さと見易さを自動評定するとともに評定結果の理由を提示するシステムを開発する.さらに,大まかな概念が知りたい・詳細な解説が欲しい,等の閲覧者のプロファイリング結果に応じ,各閲覧者に最も適したページを推薦するシステムを開発する.
2019年度においては,(1) 学術用語解説ウェブページ事例データベースの構築,(2)「説明可能なAI」型システムの開発,の二つの研究項目について研究を行い,学術用語解説ウェブページの分かり易さ・見易さの自動評定システムを開発した.
(1)においては,以下の手順で学術用語解説ウェブページ事例データベースを構築した.(1-1) 被験者アンケートにより,分かり易さ・見易さの因子となり得る情報を収集する.(1-2) 代表者・分担者の既存の成果において作成済みの学術用語解説ページの事例データベースを拡張し,全体評定・分かり易さ・見易さの良否,および,各因子の良否を格納する.
(2)においては,代表者・分担者の既存の成果において実現済みの「学術用語解説ウェブページの分かり易さ・見易さの自動評定システム」のプロトタイプに対して,「説明可能なAI」の主要方式を適用した.そして,自動評定結果に対して,どの因子が強く寄与したのかを「評定理由」として提示する「説明可能なAI」型システムを実現した.
日本学術振興会, 基盤研究(B), 筑波大学, 19H04417 - 多様なニュースサイトの比較による報道スタンスの分析と可視化の研究
科学研究費助成事業 基盤研究(B)
2018年04月01日 - 2022年03月31日
吉岡 真治, 伊藤 正彦, 神門 典子
本年度は、本研究の分析の基盤となる報道スタンスについて、特定のスタンスに属するサイトにおける特徴語について検討するとともに、単純な賛否のみに注目した分析だけでなく、ニュース記事の分類に基づいたスタンスの詳細化を行う方法を提案した。本手法では、ニュース記事の分類と賛否の情報を組み合わせることで、外交には賛成だが、経済では反対といった、より、詳細なスタンス分析が可能となる。本手法は、ユーザの興味(経済には興味はあるが外交には興味がない)と組み合わせることにより、興味に応じたスタンスの分析などに発展することが期待できる。
また、ニュース記事の賛否情報を含むメタデータのデータベースであるGDELTにおいて、不足している本文の情報について、可能な限り収集する枠組を構築し、本研究で用いるデータベースの拡充も行なっている。さらに、GDELTについている賛否情報について、その妥当性を検証するとともに、必要に応じた、再評価を行うために、深層学習による意見分析システムについても実装をはじめ、その有用性を検討している。
また、ニュース記事中の固有名詞とそのタイプを扱うために、Wikipediaのカテゴリ情報に注目した名前付き実体の分類のためのオントロジー構築についても、並行して研究を行なっている。このオントロジーとWikipediaのページのリダイレクトの情報を利用した異表記に関する知識を作成することで、名前付き実体の異表記を取りまとめて扱う方法についても検討を行なっている。
日本学術振興会, 基盤研究(B), 北海道大学, 18H03338 - 専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの研究
科学研究費助成事業 挑戦的研究(萌芽)
2019年06月28日 - 2021年03月31日
吉岡 真治, 原 真二郎, 鈴木 晃
本研究では、論文からの情報抽出・知識発見を支援するための専門用語の知識保全エコシステムを有する特定研究グループ向け論文・図表DBの提案を目指している。このシステムでは、分野の研究者が興味を持つ最新の論文を含むデータベースをPDF 解析技術を用いて構築すると共に、これらの分析に利用する情報抽出に利用可能な概念辞書の内容の更新や訓練データを作成する枠組を提供することによって、ユーザが継続的に専門用語に関する知識保全を行うエコシステム(生態系)を構築する方法を提案している。本研究では、この枠組について、申請者でシステム開発を担当する吉岡と、分担者で分野の専門家であり、このシステムを利用する立場である原・鈴木らと意見交換を行っている。以前に類似のシステムを作成した際には、専門用語の収集を支援するためのユーザインターフェースが貧弱だったために、専門用語辞書の構築に非常に手間取るといった問題があったため、本研究では、まず、この専門用語辞書の構築を支援するための用語辞書管理システムの構築が不可欠であった。そのため、本年度は、この用語辞書管理システムについて要求仕様の検討を行うと共にソフトウェア開発を行なった。このシステムを用いることにより、論文データの収集から、専門用語辞書の構築という、最初の流れが、これまでよりもスムーズに行われることが期待されるため、2020年度からの実験に向けての準備が整ったと考えている。また、応用先の専門家の集まりである応用物理学会のセッションでの発表を行うなど、この新しい考え方について、分野の専門家から意見をいただく機会も設けている。
日本学術振興会, 挑戦的研究(萌芽), 北海道大学, 19K22888 - 利用者の状況を考慮する探索的検索の技術
科学研究費助成事業 基盤研究(A)
2016年04月01日 - 2020年03月31日
神門 典子, 吉岡 真治, 山本 岳洋, 酒井 哲也, 相澤 彰子, 大島 裕明
(1)ユーザの状況の捕捉: ユーザ実験によって収集したインタラクションデータ(検索行動ログ、視線、検索前後のアンケート・コンセプトマップ・インタビューなど)を用い、検索過程における個々のユーザの状況の捕捉を研究した。タスクの認知的複雑さ(Complexity)、背景知識、タスクの自覚する困難さや満足度との関係を解析した。対象は、法律・学術における「調査」、Web、音楽を取り上げた。中国・清華大の協力により、モバイル端末を用いた検索インタラクションとユーザ背景知識、香港大学の協力により音楽検索などの「楽しみのための探索的検索Search for fun」とタスクの認知的複雑性の影響について検討した。さらに新たなインタラクション環境として、美術館博物館の来館者のタブレット端末を用いたデジタル空間での探索行動と実空間での探索閲覧行動の両面を補足し、それらを用いてよりよい探索エクスペリエンス提供を目指すすサブ課題に着手した。
(2)ユーザの状況に応じて、ユーザを支援する技術:異なる認知的複雑さタスクを選定し、検索過程でユーザを支援する技術のプロトタイプを提案した。具体的には (a)クエリマイニングによる代替検索戦略提案:コミュニティQAコーパスの質問・解答構造を利用して、同じ検索意図や目的のための異なる検索戦略をユーザに提示、(b)マルチファセット検索UIのベースラインシステムを構築し、随時、サブカテゴリや検索Trail提示の仕組みを提案した。これらの支援メカニズムが有用な状況やユーザ特性について検討を深める。さらに、情報源のスタンスなどより包括的な視点の有用性も検討した。(c)コンセプトマップが探索に与える影響について検討した。
(3) 検索の基礎技術: 今年度は、自然言語対話、モバイル端末におけるタッチインタラクション、検索実験計画法と評価法について研究をすすめた。
日本学術振興会, 基盤研究(A), 国立情報学研究所, 16H01756 - 極大類比 - その再構成
科学研究費助成事業 基盤研究(C)
2016年04月01日 - 2019年03月31日
原口 誠, 大久保 好章, 吉岡 真治
物語や判例などにおいて,各物語に固有な登場人物などの違いを超えて観察できる類似性を検出することが本研究の目的であり,登場人物や物の間に同一もしくは類似した関係が成り立つときに二つの物語は関係構造が類似しているという.本研究では2個以上の複数の物語文を与え,一定数の物語で具体化できる共通の関係構造類似性を,行列非負分解やグラフマイニングの技法を用いて抽出できるアルゴリズムを与えた.この手法はテキスト解析のみならず,複数のデータウェアハウス間の共通関係構造抽出などにも応用でき,一般的なものである.
日本学術振興会, 基盤研究(C), 北海道大学, 16K00291 - ウェブ検索における情報要求観点の言語間比較・対照分析システムの研究
科学研究費助成事業 基盤研究(B)
2014年04月01日 - 2017年03月31日
宇津呂 武仁, 吉岡 真治, 乾 孝司, 中川 裕志
本研究では,ウェブ検索者の情報要求観点を情報源とする「言語間対照分析支援システム」を作成した.具体的には,各言語の検索エンジン・サジェストおよび質問回答サイトを情報源として,特定のクエリ・フォーカスに対する情報要求観点,および,その観点に関して得られる情報を収集した.そして,収集された情報を言語間で比較・対照分析することにより,他国と自国との間の文化・関心・意見の違いを発見する過程を支援するシステムを作成した.
日本学術振興会, 基盤研究(B), 筑波大学, 26280111 - ナノ結晶デバイス開発論文からの情報抽出とその活用
科学研究費助成事業 挑戦的萌芽研究
2014年04月01日 - 2016年03月31日
吉岡 真治, 原 真二郎
本研究では、ナノ結晶デバイス開発論文を対象として、主に論文中の実験に関する条件や結果に関わる情報(材料や関係するパラメータなど)を抽出するためのコーパスの作成と、そのコーパスを利用した情報抽出システムNaDevの開発を行った。本システムを用いることにより、論文、アブストラクト、図表のキャプションから、単純なキーワードではない実験に関係するキーワードを抽出することができ、論文の類似性判定、抽出した情報を利用した検索の絞り込み支援システムなどを作成することが可能となる。本研究では、プロトタイプシステムとしての図表検索システムの提案を行った。
日本学術振興会, 挑戦的萌芽研究, 北海道大学, 研究代表者, 競争的資金, 26540165 - Linked Open Dataを用いた固有名詞タグ付けと情報検索への応用
科学研究費助成事業 基盤研究(B)
2013年04月01日 - 2016年03月31日
吉岡 真治, 神門 典子
本研究では、Wikipedia上のメタデータとして整理したDBPediaの情報を利用した固有名詞とそのタイプ(人名・地名・組織名など)の抽出を行うとともに、そのタイプの情報を考慮した情報検索に有用なインデックスについて検討を行い、固有名詞のタイプを観点(facet)として扱い、複数の観点の存在を考慮したfacet-biasedトピックモデルを提案した。また、Wikipediaの情報の一貫性をDBPediaの情報を用いて分析するためのツールであるWC3を作成し、具体的に、Wikipedia中に存在するメタデータのエラーや、カテゴリ付与の一貫性がかける事例などを指摘できることを確認した。
日本学術振興会, 基盤研究(B), 北海道大学, 研究代表者, 競争的資金, 25280035 - トピックの特性の多観点把握に基づく多言語ウェブテキストの言語間対照分析システム
科学研究費助成事業 基盤研究(B)
2011年04月01日 - 2014年03月31日
宇津呂 武仁, 吉岡 真治, 乾 孝司, 中川 裕志, 清田 陽司
本研究では,ウェブ上で収集可能な多言語ニュース・ブログ・電子掲示板等の文書を情報源として,多言語での報道内容,関心動向や,意見の分布を分析し,国・文化・言語の間でどのような違いがあるのかを発見する過程を支援する方式について研究を行った.本研究では,以下の(i)~(iv)の多様な観点における差異に着目し,各観点における差異を発見する過程を支援する方式を実現した.(i) 一つのトピックの中での詳細な話題・関心事項の差異.(ii) 国・文化・言語の間の時系列特性の差異.(iii) 書き手の実体験に関する差異.(iv) 賛否・主観の差異.
日本学術振興会, 基盤研究(B), 筑波大学, 連携研究者, 競争的資金, 23300033 - Web情報構造と利用者行動の統合分析とその情報アクセス高度化への応用
科学研究費助成事業 基盤研究(A)
2010年04月01日 - 2013年03月31日
大山 敬三, 相澤 彰子, 宮尾 祐介, 孫 媛, 小林 哲郎, 韓 浩, 岸田 和明, 山名 早人, 奥村 学, 吉岡 真治, 石田 栄美, 村田 剛志, 江口 浩二
Webの構造や利用者の情報検索・閲覧行動を総合的に理解し,応用として展開するため,Web閲覧ログデータやマイクロブログデータ等,Web情報構造とWeb利用者行動に関連する様々なデータを収集・導入し,アンケート調査とも連動させることにより,これらを統合・分析した。
その結果,知りたい情報と知らせたい情報との間の乖離や,Webポータルサイトを利用することにより意図しない情報接触行動が生ずることなど,Web利用者に関する様々な知見が実証的に得られた。また,統合・分析により得られた情報に基づいて,情報推薦や情報検索等の情報アクセスを高度化するための様々な手法を研究・提案した。
日本学術振興会, 基盤研究(A), 国立情報学研究所, 22240007 - 異なる特徴を持つニュースサイトを比較対照する世界ニュース分析システムの研究
科学研究費助成事業 基盤研究(B)
2009年 - 2011年
吉岡 真治, 神門 典子, 関 洋平
本研究は、日中韓の異なる言語で記述されているニュースサイトの内容を比較対照することにより、ニュース分析を行うシステムを提案した。この中で、多様な観点からのニュースを比較するためのマルチファセット分析と、その分析を支えるための、地名などのデータベースの構築、意見分析システムの構築を行った。さらに、このようなシステムを評価するために、システム利用前後の知識の変化に注目したシステムの分析手法の提案を行った。
日本学術振興会, 基盤研究(B), 北海道大学, 研究代表者, 競争的資金, 21300029 - 個々のWebサイトが持つ情報の特性を考慮した多角的意見集約・分析の研究
科学研究費助成事業 特定領域研究
2007年 - 2008年
吉岡 真治, 原口 誠, 大久保 好章
本研究では、情報抽出元である各々のWebサイトが持つ情報の偏りなどの特徴を分析する方法を提案すると共に、この特徴分析の結果を踏まえた意見集約・分析の方法を提案している。具体的には、全てのデータセットを含む全体のデータベースと特定の条件を満たす部分データベースにおけるデータの分布の違いに注目したコントラストセットマイニングを適用することにより、個々のサイトの特徴を分析する方法を提案する。
この目標に対して、本年度は、「コントラストセットマイニングによる個々のサイトの特徴分析」の考え方に基づくシステムを実装し、様々なレベルのユーザ実験を通した評価を行った。簡単にシステムを使用してもらってコメントをもらうというユーザ実験では、半数以上の利用者から、システムが有用であるというコメントをもらえた。一方、レポート作成課題の実施という本システムの利用目的に応じた課題の遂行という実験を行ったところ、異なる国のデータとの比較を行う際には、外国語の新聞を直接の比較対象とする必要性などが指摘された。この指摘を受け、機械翻訳システムと組み合わせることによりシステムを作成した。このシステムでは、ニュースなどの時事的なトピックに対する対訳辞書の不備を補うためのWikipediaを用いた対訳辞書の作成方法などの提案も行った。また、ピンポイントクラスタリングによるWebサイトの分析」の課題については、昨年度から継続して、フォーマルコンセプト(FCA)を用いた分枝限定法にもとづくトップN-FC探索手法の研究を行った。
日本学術振興会, 特定領域研究, 北海道大学, 研究代表者, 競争的資金, 19024002 - 抽象化に基づく情間構造マイニング
科学研究費助成事業 基盤研究(B)
2007年 - 2008年
原口 誠, 富田 悦次, 伊藤 公人, 吉岡 真治, 大久保 好章
潜在的なクラスタ間接続を, たとえ, 外延的な重なりが小さな場合でも, 内包的な繋がりが高い場合は有意義なクラスタ間接続関係を与える「情間」と捉える.こうした「情間」は, クラスタの外延と内包に対する評価関数を設定することにより, 制約条件下の最適化問題として捉えることができ, 具体的には, 形式概念束探索における分枝限定アルゴリズムとして設計・開発・実証を行った.形式概念束は, 概念の抽象階層と見なすことができ, 主要なクラスタを繋ぐ適切な概念を抽象階層から見出すことを意味している.実証実験において, カテゴリとしては離れた異種文書群から, それらを跨ぐ, 機能的な概念を情間(クロスオーバ概念)として抽出することに成功している.
日本学術振興会, 基盤研究(B), 北海道大学, 連携研究者, 競争的資金, 19300040 - 問題解決を目的とした文書作成支援型知識マネージメントシステムの研究
科学研究費助成事業 若手研究(B)
2005年 - 2007年
吉岡 真治
本研究では、問題解決を目的とした文書作成支援型知識マネージメントシステム(Documentation MAnagementsystem for Problem Solving:DMaPS)の構築を目的とした研究を実施した。このシステムでは、問題解決の支援、文書と形式化された知識の蓄積、文書からの知識の獲得というループの実現を目指している。この目的に対し、平成17年度は、問題解決の支援を行うために、ユーザが持っている問題に関する記述と類似している文書知識を提示することにより、問題解決の支援を行うシステムを作成した。本システムに対し、あらかじめ手作業により作成した知識を埋め込んだ文書群を与えることにより、問題解決の支援が可能であることを確認した。平成18年度以降は、主に、一般的な文書から問題解決に役立つ知識を獲得するための方法論に注目して研究を遂行した。具体的には、トラブル事例に関する知識獲得を目指して、新聞記事などから、ユーザが直面している問題に関連する訴訟の記事などを検索し、その検索結果から、関係する利害関係者とその関係を抽出するシステムの構築を行った。本システムでは、少数の訓練事例にたいして、複数の基準を用いた機械学習システムを適用し、その結果を組み合わせることによって、人手で作成したパターンでは抽出することができなかった多くの利害関係者の情報を獲得することが確認できた。また、文書分類の研究では、特許を関連する物理法則によって分類する考え方を提案し、Web上に存在する様々な物理法則に関する文書の情報などを利用して、具体的な特許文書を分類する方法を提案した。ただ、これらで得た知識は、DMaPSで利用可能なレベルの知識での形式化が困難であったため、今後は、形式的な知識作成に関する検討を進める必要がある。
日本学術振興会, 若手研究(B), 北海道大学, 研究代表者, 競争的資金, 17700087 - 適合的汎化に基づく情報検索システムの実験的研究
科学研究費助成事業 特定領域研究
2004年 - 2005年
吉岡 真治, 原口 誠, 大久保 好章
本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。
そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化し、新たな検索式を作成する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。
本年度は、検索式における検索語と検索要求のミスマッチという観点から検索課題の持つ性質の分類を行うと共に、検索語拡張に与える影響を分析した。その結果、検索語と検索要求のミスマッチのタイプに応じて、検索語拡張に求められる機能も異なり、単一の検索語拡張手法では、検索性能を改善させる場合だけでなく、性能を悪化させる場合があることが確認された。よって、検索語拡張の洗練化を行うためには、検索語と検索要求のミスマッチに応じた検索語拡張の方法の提案と、ミスマッチのタイプの推定を行うことが必須であることを提案した。
日本学術振興会, 特定領域研究, 北海道大学, 研究代表者, 競争的資金, 16016201 - 極大類比による文書データの汎化とその利用
科学研究費助成事業 基盤研究(B)
2004年 - 2005年
原口 誠, 田中 譲, 角田 篤泰, 吉岡 真治, 大久保 好章
本研究の最終目標は、文化的背景ないし目的を共有する人々が、類似していると考える文書群に共通なストーリー構造を抽出し、抽出された構造をスクリプト的に用いることにより、より直感的で人々の共感を得やすい文書を生成するための基盤技法を確立することにある。主な具体的な成果は以下の通りである。
イベント列としての物語を、主題を中心にして分割するために、テキストセグメンテーションにより、連続したイベントからなる複数のイベントブロックに分割する。ブロック毎に話題を表す語彙(中心語彙群)を共起性に基づくグラフにおけるクリークとして抽出し、話題は共起に関して密に結合された語彙集合として定める。次に、話題を結びつける機能を持つ語彙もしくはイベントを特定する。昨年度実装した方式は手がかかり語によってアドホックに決める方式であったが、本年度は、キーグラフ同様に、異なる中心語彙群との相関により話題に基づく支持度を求め、複数の話題に共通に支持される度合いを語彙が持っ話題結合度として定めた。話題結合度の高い語彙は、文脈的な語彙として捉えることが可能であり、そうした結合度の高い語彙をより多く含むイベントを複数のブロックを繋ぐイベントとして抽出する。
上記の手法で同定された物語構造(イベントブロック-中心語彙群-ブロック結合構造)を保存する構造写像を高速に算出するためのアルゴリズムを、イベントブロックの分割統治と過度の抽象化を抑制する制御規則を持つものとして策定した。高速化のポイントは、分割統治の効果と過度の抽象化の制御規則が固有に持つ枝刈規則に加え、中心語彙群と結合構造の保存性スコアーを新たに導入し、そのスコアー下限値(事前に与える)に基づく枝刈規則を新たに与える点にある。これら3種類の探索枝刈の実装により、一般には指数オーダの処理が必要になる構造類比の算出手法の高速化に対する新たな道を切り開いた。
日本学術振興会, 基盤研究(B), 北海道大学, 連携研究者, 競争的資金, 16300039 - 創造的アブダクションによる設計支援の研究-Universal Abduction Studioの開発-
科学研究費助成事業 基盤研究(B)
2002年 - 2004年
武田 英明, 下村 芳樹, 吉岡 真治, 冨山 哲男
本研究で提案するUniversal Abduction Studioとは、設計者の創造的な思考を支援するために、目的思考の知識操作を可能にする環境である。ここで知識操作とは、様々な領域知識を新しい設計目的の元に関係性を発見し、再構成する操作である。本研究では、設計問題で見られるような実世界の問題を解決するような創造的アブダクションのモデル化を行う。
まず、どのような設計知識が利用されているかを調べるため、設計に関する本から知識抽出を試みた。この抽出された知識を分析することで、設計知識は多様な解釈が可能である必要性、オントロジーの必要性などがわかった。
次に設計知識をどのように計算机上で表現するかについて議論を行い、Semantic Webにおける方法論を参考に、独自の知識表現を提案した。設計知識を構成する要素として、述語オントロジー、対象オントロジー、属性オントロジーを用意し、設計知識そのものはRDFのグラフ構造として表現する方法を提案した。この提案に基づいて、設計知識のエディタ、この知識を用いた類似推論のシステムを構築した。
日本学術振興会, 基盤研究(B), 国立情報学研究所, 連携研究者, 競争的資金, 14380170 - 適合的汎化に基づく情報検索システムの実験的研究
科学研究費助成事業 特定領域研究
2003年 - 2003年
吉岡 真治, 大久保 好章, 原口 誠
本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。
そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化し、新たな検索式を作成する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。
本年度は、この適合的汎化による検索拡張が、正解文書において補完関係にある検索語の発見を目指しているという点に注目し、適合的汎化による検索拡張の結果をBoolean式として表現する方法について検討を行った。さらに、実際にユーザが利用可能なインターフェースの作成を行った。また、文書中の語の役割を反映した抽象概念の提案手法についても検討を行った。これらの手法の有効性は、実際のユーザ実験によって検討する必要性がある。次年度以降は、ユーザ実験などを通して、本手法の有効性の検証と手法の洗練化を図っていきたいと考えている。
日本学術振興会, 特定領域研究, 北海道大学, 研究代表者, 競争的資金, 15017202 - 適合的汎化に基づく情報検索システムの実験的研究
科学研究費助成事業 特定領域研究
2002年 - 2002年
吉岡 真治, 大久保 好章, 原口 誠
本研究では、検索者にも理解しやすい概念階層の汎化という考え方を利用して、ユーザの検索意図を明示化すると共に、精度落ちを抑えた情報検索システムを提案している。この概念階層を利用する情報検索システムでは、汎化の対象としてどの様な語を選ぶのかという問題に加え、あらかじめ用意する辞書における概念階層の性質に結果が依存するという問題がある。
本年度は、汎化のための方法論として、適合文書群に共通する概念を利用する方法を検討した。学術論文のアブストラクトを用いたNTCIRや新聞記事を用いたIREXの2つの情報検索のテストコレクションを利用し提案手法のシステムの検索性能への影響を検討した。その結果、提案手法により検索性能が向上することが確認できた。
次に、辞書の性質を議論するために、昨年度までの研究で用いていたEDR電子化辞書に加え、日本語概念語彙体系という異なるタイプのシソーラスを用いた場合の影響に関する分析を行った。検索実験の結果、日本語概念語彙体系を用いた場合に、与えた適合文書へのオーバーフィットの度合いが高いことが確認された。これは、日本語概念語彙体系とEDRが持つ概念カテゴリーの粒度の違いによるものであると考えられる。日本語概念語彙体系とEDRが持つ概念カテゴリーの数を単純に比較すると、EDRは約50000個(専門用語辞書のものを含む)であり、日本語概念語彙体系は約3000である。よって、適合的汎化による情報検索システムで用いるシソーラスは、ある程度、粒度の細かい概念を扱うことができるシソーラスであることが望まれることが確認された。
日本学術振興会, 特定領域研究, 北海道大学, 研究代表者, 競争的資金, 14019002 - 設計対象モデルを用いた設計文書の体系的管理と再利用に関する研究
科学研究費助成事業 若手研究(B)
2001年 - 2002年
吉岡 真治
本研究では、設計問題に代表される問題解決の過程を問題を表現するためのモデルとそこで用いられた知識さらに、その際に記述された文書を組み合わせて保存することにより、設計文書の体系的管理と再利用を実現することを目的とした。その成果として、問題解決のための文書管理システムDMaPS(Documentation Management system for Problem Solving)を提案した。
このDMaPSでは、ひとつのサブ問題の問題解決の過程を単位として考えた文書知識を利用して、文書の管理と問題解決の支援を行う。この文書知識では、文書を単純なテキスト情報として保存するだけではなく、知識を適用する背景となる条件や形式的な知識を一階述語論理によって表現する、この二つの表現を組み合わせることにより、マニュアルなどの形式知とノウハウのように形式化が困難な情報を組み合わせて取り扱うことが可能となる。
本システムでは、この文書知識を用いることにより、ユーザの問題解決の支援を行う。具体的には、ユーザが直面している問題との一階述語論理による形式的表現に関する類似性とキーワードによる情報検索による類似性という異なる観点から知識の検索を行うことができ、より柔軟な知識の検索を実現する。また、検索された知識を取り込むことにより、問題解決の過程を説明するための文書が半自動的に作成でき、ユーザは個別事例に適応させる部分の記述に専念することができる。さらに、本システムでは、知識のバージョン管理の機構を取り込んでおり、各文書問題解決の際に利用した知識のバージョンをチェックすることにより、既存の設計文書をそのまま再利用してよいのか、再検討が必要なのかを調べることが可能になっている。
本研究では、建築構造物の基礎設計を例にとり、知識記述の実験を行い、体系的な知識整理が可能であることを示した。
日本学術振興会, 若手研究(B), 北海道大学, 研究代表者, 競争的資金, 13750129 - 適合的汎化に基づく情報検索システムの実験的研究
科学研究費助成事業 特定領域研究(C)
2001年 - 2001年
吉岡 真治, 大久保 好章, 原口 誠
本研究では、検索意図を推定し、それをユーザにも理解しやすい形式で表現できる情報検索システムを提案する。ここでは、検索者が用いる検索語の抽象度に注目して、検索意図の推定を行う。
しかし、ユーザは、検索意図を表現するのに適切な抽象度の概念を必ずしも用いない場合がある。そのため、検索意図に応じた適切な抽象度の概念を検索キーワードに用いると、ユーザにも理解しやすく効率的な検索キーワードになると考えられる。
そのため、本研究では、電子化辞書やシソーラスに記述されている概念階層構造を利用し、検索意図に応じて検索キーワードを適合的に汎化する情報検索システムを提案する。ここで、適切な抽象度の汎化とは、検索キーワードが持つ正解判定の分別能力に関する情報を多く保存する汎化の事である。
一方、電子化辞書やシソーラスでは、一般的な概念階層が記述されているために、多段階の階層を用いた汎化を行った際に、一度に大量の語を代表する概念に汎化されてしまう問題がある。例えば、「ビデオ」と「DVD」を汎化した概念として「映像装置」という概念を考えたときに、8mmカメラは含むことは、検索意図と必ずしも一致しないと考えられる。そのため、ユーザが持つ細かな検索意図を適切に表現するために、検索目的に応じた適切な抽象概念を設定し、概念階層を再構築することが必要である。
本年度は、概念の適切な抽象化のための指標として、キーワードと正解文書の相互情報量に基づく関連性の指標を利用し、情報検索システムを構築した。本システムは、5件の正解文書を与えることにより、検索語の汎化を行い、検索者の意図が理解しやすい検索式が作成可能である。また、この検索式による検索は、他の検索システムと比較して十分な検索精度を持っていることを確認した。
日本学術振興会, 特定領域研究(C), 北海道大学, 研究代表者, 競争的資金, 13224001 - ネットワークにおけるコミュニケーション支援のための知識ライフサイクルの研究
科学研究費助成事業 基盤研究(B)
1999年 - 2001年
武田 英明, 竹内 孔一, 上野 敦志, 西田 豊明, 吉岡 真治, 市瀬 龍太郎, 岩爪 道昭, 久米 出
本研究ではネットワークにおけるコミュニケーション支援のための知識ライフサイクルを実現するために「メディアとしての知識」という概念を提起した.ここでは知識は個別の人や計算機(エージェント)の内部にあるのではなく,コミュニケーションを可能としているものが知識であるという概念である.このように考えるとき知識は閉じたものではなく開いたものになり,個々の人や計算機の内部でなくそれらの中間にあることになる.メディアとしての知識を再定義することで,本研究の各研究は体系的に位置付けられる.すなわち,オントロジーはエージェント間で共通性の高い知識であり,コミュニティの知識,環境の知識は中間であり,身体性に基づく知識は個別性の高い知識である.また人と計算機・機械という軸で考えると,オントロジーと身体性に基づく知識は共通性を目指すの対して,コミュニティの知識,環境の知識は人や機械の特質を取り込む知識であるといえる.
具体的には3つの成果がある.まず,コミュニティシステムにおいてはインタフェースエージェントを用いたコミュニティ活動支援システムTelMeAの被験者実験を行い,評価を行った.この評価においては本システムはこれまでのテキストだけのシステムに比べてマルチモーダルな会話が行えることが確認できた.また主観評価ではすべての面でテキストによるシステムの評価を上回り,ユーザに受け入れやすいシステムであることが確認でした.
個人的知識を獲得するシステムにおいても被験者実験を行い,十分な効果があることが確認できた.このシステムにおいてシステムが提案してくる過去のメモ(リンク)はユーザに受け入れやすいものであったこと,またこのメモに基づく要約においてもよい性能があることがわかった.
身体性に基づく知識としてロボットが自律的に自らの身体に基づく行動がとることが可能な学習方法を提案した.これよって身体形状を事前に与えられなくても行動を通じて身体に関する知識を獲得することが可能になった.
日本学術振興会, 基盤研究(B), 奈良先端科学技術大学院大学->国立情報学研究所, 連携研究者, 競争的資金, 11480078 - 研究ネットワークの国際連携とアジア・大洋州における国際調整に関する学術調査
科学研究費助成事業 国際学術研究
1995年 - 1997年
猪瀬 博, 酒井 善則, 瀬崎 薫, 飯田 記子, 安田 靖彦, 藤野 貴之, 吉岡 真治, 趙 偉平, 阿部 俊二, 魚瀬 尚郎, LANDWEBER L, 相澤 彰子, 計 宇生, 大山 敬三, 松方 純, 橋爪 宏達, 安達 淳, 宮澤 彰, 浅野 正一郎, 浜田 喬, 小野 欽司, LANDWEBER La, 山田 尚勇
近年の学術研究の国際化に伴い、国際的な連携が図られた研究ネットワークの運用が求められている。ことに、アジア、大洋州、北米、欧州に加えて、東欧・ロシア、南米、アフリカの地域に研究ネットワークが拡大したことによる国際調整の在り方を検討することは緊急の課題であり、また研究ネットワークの超高速化に伴う技術課題の調整も重要となる。
今年度は、国際的な学術研究ネットワークの調整を行っている国際研究ネットワーク調整会議で主要な論議がなされている研究ネットワークの国際的相互接続の検討に参加し、同時に検討を主導することにより、次世代の国際研究ネットワークの形成に寄与した。更に成果を反映して、米国シカゴに設置された高速研究ネットワークの国際交換点(STAR-TAP)を経由して、学術情報センターが運用するSINETを接続し、超高速通信の環境を日本の研究者に提供している。
欧州では、TEN-34と称する超高速研究ネットワークの運用が開始される一方、各国の協力により次世代ネットワークの開発計画(JAMES)が進行している。従来の経緯を踏まえて、学術情報センターは英国ロンドンを起点としてTEN-34との接続のための調整を続け、接続を実現するに至っている。また同時に、JAMESの調査を実施している。並行して、OECDでは情報社会の実現に向けて政索の強調が続けられているが、これに副議長として参加し、議論を主導した。
国際的なネットワーク技術の標準化組織であるIETFには、今年は新たに超高速ネットワークの運用に関する基本技術を2件提案している。このために、IETFには継続的に参加し、国際貢献を果たしている。
以上のように、今年度は当初の計画を大幅に上回る成果を得ている。以上をもって、3ヶ年にわたる本調査を終了する。
日本学術振興会, 国際学術研究, 学術情報センター, 連携研究者, 競争的資金, 07041116 - 大規模知識ベースを用いた設計支援の研究
1996年
競争的資金