Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Takatsugu Nokubi
2,429 views
Language toolを使ってみる
Technology
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 10
2
/ 10
3
/ 10
4
/ 10
5
/ 10
Most read
6
/ 10
7
/ 10
8
/ 10
9
/ 10
Most read
10
/ 10
Most read
More Related Content
PDF
Goets go言語のelastic transcoderライブラリを作ろうとした @ qiita aws tools hackathon
by
Takuya Ueda
PPTX
新人プログラマーが気に入ったPythonの基礎の基礎
by
iPride Co., Ltd.
PDF
Golang入門
by
Yukihiro Kitazawa
PPTX
もっとドキュメントが日本語になりますように
by
Takako Miyagawa
PDF
Golangによるubicの試作
by
kn1kn1
PPT
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
by
mick
PDF
Trac 0.12 と今後の動向および Trac への貢献 - tanabata.trac 2010-07-07
by
Jun Omae
PDF
PyLadies Tokyo 二周年記念パーティ LT
by
Tetsuya Morimoto
Goets go言語のelastic transcoderライブラリを作ろうとした @ qiita aws tools hackathon
by
Takuya Ueda
新人プログラマーが気に入ったPythonの基礎の基礎
by
iPride Co., Ltd.
Golang入門
by
Yukihiro Kitazawa
もっとドキュメントが日本語になりますように
by
Takako Miyagawa
Golangによるubicの試作
by
kn1kn1
オープンソースカンファレンス名古屋「高蔵寺SE勉強会」
by
mick
Trac 0.12 と今後の動向および Trac への貢献 - tanabata.trac 2010-07-07
by
Jun Omae
PyLadies Tokyo 二周年記念パーティ LT
by
Tetsuya Morimoto
What's hot
PDF
PyCon JP 2016 ビギナーセッション
by
Tetsuya Morimoto
PDF
Isomorphic Architecture & Interface
by
Jxck Jxck
PDF
LT_Gitのfast fowardと継続的デリバリー
by
sinsoku listy
ODP
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
by
Naoki Matsumoto
PDF
20091107 Phpstudy
by
Yusuke Ando
PDF
Kanrk05 .Netでお仕事しているプログラマがスクリプト言語として使うRuby
by
Shinichi Okada
PDF
QtとBuildrootの紹介
by
Naoki Matsumoto
PyCon JP 2016 ビギナーセッション
by
Tetsuya Morimoto
Isomorphic Architecture & Interface
by
Jxck Jxck
LT_Gitのfast fowardと継続的デリバリー
by
sinsoku listy
Qt名古屋勉強会へのお誘い(OSC名古屋2017LT)
by
Naoki Matsumoto
20091107 Phpstudy
by
Yusuke Ando
Kanrk05 .Netでお仕事しているプログラマがスクリプト言語として使うRuby
by
Shinichi Okada
QtとBuildrootの紹介
by
Naoki Matsumoto
More from Takatsugu Nokubi
PPTX
Text gen-and-gpt2
by
Takatsugu Nokubi
PDF
10年ぶりの ニューラルネットワーク
by
Takatsugu Nokubi
ODP
自由なデータ
by
Takatsugu Nokubi
PDF
自由ソフトウェアによるライブストリーミング
by
Takatsugu Nokubi
PPTX
AIと金融
by
Takatsugu Nokubi
PPTX
qemu-debootstrap
by
Takatsugu Nokubi
Text gen-and-gpt2
by
Takatsugu Nokubi
10年ぶりの ニューラルネットワーク
by
Takatsugu Nokubi
自由なデータ
by
Takatsugu Nokubi
自由ソフトウェアによるライブストリーミング
by
Takatsugu Nokubi
AIと金融
by
Takatsugu Nokubi
qemu-debootstrap
by
Takatsugu Nokubi
Recently uploaded
PDF
visionOS TC「新しいマイホームで過ごすApple Vision Proとの新生活」
by
Sugiyama Yugo
PDF
基礎から学ぶ PostgreSQL の性能監視 (PostgreSQL Conference Japan 2025 発表資料)
by
NTT DATA Technology & Innovation
PPTX
DrupalCon Nara 2025の記録 .
by
iPride Co., Ltd.
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):東京大学情報基盤センター テーマ1/2/3「Society5.0の実現を目指す『計算・データ・学習...
by
PC Cluster Consortium
PDF
第25回FA設備技術勉強会_自宅で勉強するROS・フィジカルAIアイテム.pdf
by
TomohiroKusu
PDF
安価な ロジック・アナライザを アナライズ(?),Analyze report of some cheap logic analyzers
by
たけおか しょうぞう
visionOS TC「新しいマイホームで過ごすApple Vision Proとの新生活」
by
Sugiyama Yugo
基礎から学ぶ PostgreSQL の性能監視 (PostgreSQL Conference Japan 2025 発表資料)
by
NTT DATA Technology & Innovation
DrupalCon Nara 2025の記録 .
by
iPride Co., Ltd.
PCCC25(設立25年記念PCクラスタシンポジウム):東京大学情報基盤センター テーマ1/2/3「Society5.0の実現を目指す『計算・データ・学習...
by
PC Cluster Consortium
第25回FA設備技術勉強会_自宅で勉強するROS・フィジカルAIアイテム.pdf
by
TomohiroKusu
安価な ロジック・アナライザを アナライズ(?),Analyze report of some cheap logic analyzers
by
たけおか しょうぞう
Language toolを使ってみる
1.
LanguageToolを 触ってみる 野首貴嗣 knok@daionet.gr.jp
2.
日本語校正・誤字チェック ● (かつては)自由な実装がなかった ○ GNU
Aspell ■ jaのエントリーだけはある ■ 必要なコードすらない ● Doc-ja MLでLTの存在を教えてもらう ○ http://mail.ring.gr.jp/doc-ja/201210/msg00004.html
3.
LanguageToolの概要 ● Doc-ja Wikiにまとめてある ○ http://openlab.ring.gr.jp/doc-ja/cgi-bin/fswiki/wiki.cgi? page=LanguageTool%BB%C8%A4%A4%CA%FD%A5%E1%A5%E2 ●
各国の言語処理ツールと辞書の詰め合わせ ○ 共通化したAPIで使える ○ 詰め合わせなので、各種実装と辞書のライセンスはば ばらばら ■ すべてオープンソースソフトウェア
4.
LanguageToolの特徴 ● 開発・実行環境はJava ○ Ver
2.3からJava7必須 ● 動作環境 ○ LibreOffice/OpenOffice プラグイン ○ Firefox プラグイン ○ スタンドアロン
5.
Webで試せる http://www.languagetool.org/
6.
しかしルールが少ない… ● http://community.languagetool. org/rule/list?lang=ja ○ 23種類
7.
試しにルールを書いてみた <rule id="DOUBLE-WO" name="をを"> <pattern
case_sensitive="no"> <token>を</token> <token>を</token> </pattern> <message>重複したを</message> <example type="correct"><marker>を</marker>話す</example> <example type="incorrect"><marker>をを</marker>話す</example> </rule>
8.
超シンプル ● 特定の単語の連続を見てるだけ ● もっと複雑なルールもできる ○
品詞情報に基づくもの ■ どんな処理をされるかは-tオプションで確認 ○ 正規表現 ○ Javaコードで記述する方法 ■ 日本語のものは2つ
9.
今後どうするか ● ルールの拡充 ○ WebのRule
Creatorはうまく動かない? ■ http://www.languagetool.org/ruleeditor/ ○ 用例を集める ■ 各種翻訳MLを参考に ○ 日本語のルールに基づいた複雑なパターン ■ Javaで記述するタイプのルール ● かける人がいるのかどうか
10.
できたらいいな ● Google Summer
of Code ○ LTの中国語対応はGSoCの成果 ○ Doc-jaがmentorをやる? ● 機械的な収集 ○ Wikipedia等から ○ 形態素解析させて、変なつながりのものを探す ○ 教師なし学習でがんばれるか?
Download