Skip to content

文法誤り訂正に関する日本語文献を収集・分類するためのリポジトリ

Notifications You must be signed in to change notification settings

gotutiyan/GEC-Info-ja

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 

Repository files navigation

目的

  • 日本国内の学会や雑誌で発表された,文法誤り訂正に関係する文献を収集・分類することを目的としています.

    • 英語で書かれた文献でも,上の条件に該当すれば掲載されます.
    • 査読の有無を問わず掲載していますが,査読有りの文献は査読カラムに「有」と表記されます.
  • 国際会議の文献を対象に収集・分類したものはGEC-Infoにあります.

目次

まとめ・サーベイなど

タイトル リンク Note
私のブックマーク 「自然言語処理による文法誤り訂正」 [website] [pdf] 2011-2018ごろの文法誤り訂正の動向を追うのに有用.

チュートリアル

タイトル Note
ライティング支援のための文法誤り訂正

英語を対象とするもの

評価尺度

キーワード/概要 Year 論文 査読 Note
2017 文法誤り訂正のためのリファレンスレス評価
2017 文法誤り訂正の文単位評価におけるリファレンスレス手法の評価性能
2018 文法性・流暢性・意味保存性に基づく文法誤り訂正の参照無し評価
2020 訂正難易度を考慮した文法誤り訂正のための性能評価尺度
2021 文法誤り訂正の参照文を用いない自動評価の人手評価への最適化
2022 IMPARA: パラレルデータにおける修正の影響度に基づいた文法誤り訂正の自動評価法
2023 文法誤り訂正におけるメタ評価の再考
2024 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性
2024 文法誤り訂正の自動評価のための原文・参照文・訂正文間のN-gram F-score
2024 文法誤り訂正における参照なし評価尺度を用いた分析的評価法 スライド

モデル

キーワード/概要 Year 論文 査読 Note
2011 自動獲得されるルールに基づく英文冠詞誤り校正手法における最大エントロピー分類器の利用
2012 大域的文脈情報を用いた英語時制誤りの検出と訂正
2012 冠詞誤り訂正時における訂正根拠の提示
2012 英語スペリング訂正と品詞タグ付けの結合学習
2013 学習者の誤り傾向を反映した英語動詞選択誤りへの訂正候補推薦
2013 前置詞誤り検出/訂正のための誤り格フレームの生成
2014 誤り理由を考慮したニューラル文法誤り訂正
2014 定冠詞の前方照応用法を考慮した冠詞誤り訂正
2014 誤りに関する説明を提示可能な前置詞誤り訂正手法
2014 複単語表現を考慮した英語文法誤り訂正
2015 高度な英文訂正への統計的機械翻訳技術の適用
2015 ベクトル空間モデルを用いた英文コロケーション誤り訂正
2016 文脈を考慮した前置詞誤り訂正に向けた前置詞とその潜在意味関係の同時解析
2016 リランキングによる文法誤り訂正/訂正候補提示の性能改善
2017 学習者英語のための綴り誤り訂正手法と綴り誤り分析への応用
2017 文法誤り訂正のための疑似誤り生成によるラベルなしコーパスの利用
2018 ニューラル機械翻訳モデルを用いたマルチソース文法誤り訂正
2018 パイプライン処理によるニューラル英語文法誤り検出と訂正
2018 ニューラル文法誤り訂正モデルにおける低頻度語処理法の提案
2018 低頻度語学習手法を用いたConvolutional Encoder-Decoderモデルによる文法誤り訂正
2019 教師なし文法誤り訂正
2019 文法誤り訂正における単語編集率を用いた訂正度の制御
2020 学習者の誤り傾向を考慮した擬似データを用いた文法誤り訂正 ロシア語の実験もあり
2020 教師付き注意機構を用いた文法誤り訂正
2020 大規模疑似データを用いた高性能文法誤り訂正モデルの構築 スライド
2020 分類器による英文前置詞誤り訂正の学習法
2021 文法誤り訂正における訂正度を考慮した多様な訂正文の生成
2021 高再現率な文法誤り訂正システムの実現に向けて
2021 L1-aware Grammatical Error Correction via Multitasking with Native Language Estimation
2022 Masked Language Model による系列確率に基づく文法誤り検出
2022 後続文脈の考慮が文法誤り訂正性能にもたらす影響の調査 スライド
2023 訂正文の流暢性向上を目的とした系列タグ付け文法誤り訂正器の強化学習手法 ポスター
2023 対訳コーパスへの擬似文法誤りの挿入による翻訳誤り訂正データの構築

データセット

キーワード/概要 Year 論文 査読 Note
KJコーパス 2011 文法誤り情報および品詞/句情報付き英語学習者コーパスの構築
2017 綴り誤り研究のための日本人英語学習者コーパスの構築
2022 日本語文法誤り訂正評価コーパスへの誤用タグ付け

アノテーション

キーワード/概要 Year 論文 査読 Note
2015 英語学習者の作文における誤りタグの自動付与
2015 英語学習者コーパスのための句構造アノテーション

擬似データ生成

キーワード/概要 Year 論文 査読 Note
2020 英語学習者の母語を考慮した文法誤り訂正のための擬似データ生成
2021 ニューラル文法誤り訂正のための多様な規則を用いる人工誤り生成
2021 文法誤り訂正モデルのエラー分析に基づく疑似データ生成の効果検証
2022 多様な規則を活用した文法誤り訂正のデータ拡張に関する分析

データクリーニング

キーワード/概要 Year 論文 査読 Note
2020 文法誤り訂正のための自己改良戦略に基づくノイズ除去 スライド

分析

キーワード/概要 Year 論文 査読 Note
2010 英文冠詞誤りの自動校正手法におけるアプローチの違いによる傾向分析
2012 大規模英語学習者コーパスを用いた英作文の文法誤り訂正の課題分析
2014 統計的機械翻訳に基づく英語文法誤り訂正におけるフレーズベースと統語ベースの比較と分析
2014 統計的機械翻訳を用いた英語文法誤り訂正の結果をリランキングすることで訂正性能の改善はできるか?
2015 英語校正 「Project Next英文校正タスク: 前置詞誤りを対象とした誤り分析」
2015 英単語タイピングゲームによるスペリング誤りの抽出と分析
2016 文法誤り訂正における問題点の考察と新タスクの提案
2017 英語学習者の文法誤りパターンと正誤情報を考慮した単語分散表現学習
2019 文法誤り訂正のコーパス横断評価 : 単一コーパス評価で十分か? スライド
2019 ⽂法誤り訂正における反復訂正の効果検証
2021 文法誤り訂正モデルは訂正に必要な文法を学習しているか スライド
2021 文法誤り訂正における複数の逆翻訳モデルを利用した訂正傾向の比較
2021 文法誤り訂正モデルの横断評価
2022 文法誤り訂正への訂正重要度の導入
2022 ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析
2022 文法誤り訂正における訂正難易度の判別可能性 スライド
2023 文法誤りにおける一般誤りの分離可能性と解説文生成への応用
2023 第二言語としての日本語学習者が産出する文法的誤りに対する生成文法理論からのアプローチ:生成誤り分析
2023 Exploring how well Large-scale Masked Language Models can Recognize Grammatical Errors

誤り検出

キーワード/概要 Year 論文 査読 Note
2010 学習効果を最大とするための英文誤り検出の性能評価
2011 Stativity判定に基づいた時制誤り検出
2018 正誤情報と文法誤りパターンを考慮した単語分散表現を用いた文法誤り検出
2019 深層言語表現モデルに対するマルチヘッド・多層アテンションによる英語文法誤り検出
2022 大規模マスク言語モデルの文法誤り認識能力
2024 文法誤り検出BERTのためのマルチタスク追加事前学習

文法誤り訂正・検出以外の学習者英語を対象とした話題

キーワード/概要 Year 論文 査読 Note
2013 前方文脈を考慮した冠詞の推定
2014 非母語話者英語における母語の親縁関係の保持
2015 英語学習者コーパスにおける名詞句発達分析
2015 運用能力レベル別に見る英語学習者発話の情報構造
2016 日本語学習者の作文における誤用タイプの階層的アノテーションに基づく機械学習による自動分類
2016 誤りの傾向と文の容認性に着目した英作文のレベル判定
2016 英語動詞の適切な使い分けを支援するシステムの開発
2016 冠詞推定のための情報構造仮説の検討
2017 スペル誤りに着目した学習者の英語に対する品詞タグ付け・チャンキングの性能調査
2018 品詞解析の学習者英語への分野適応
2018 綴り誤りが語彙の豊富さの指標に与える影響の分析

日本語を対象とするもの

モデル

キーワード/概要 Year 論文 査読 Note
2009 重み付き有限状態トランスデューサーを用いた文字誤り訂正
2011 大規模添削コーパスを用いた統計的機械翻訳手法による日本語誤り訂正
2011 日本語教師のための誤り訂正ローマ字かな変換
2012 日本語学習者の作文の誤り訂正に向けた単語分割
2012 識別的系列変換を用いた日本語助詞誤りの訂正
2012 日本語学習者の誤り傾向を反映した格助詞訂正
2013 日本語学習者の作文自動誤り訂正のための語学学習SNSの添削ログからの知識獲得
2014 小規模誤りデータからの日本語学習者作文の助詞誤り訂正
2014 Particle Error Correction from Small Error Data for Japanese Learners
2019 分類モデルを用いた日本語学習者の格助詞誤り訂正
2020 非自己回帰モデルを用いた高速な日本語文法誤り訂正
2022 高速な文法誤り訂正機能を持つ日本語ライティング支援システムの構築

データセット

キーワード/概要 Year 論文 査読 Note
2020 日本語学習者の文法誤り訂正のための評価コーパス構築
2021 日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良
2022 日本語文法誤り訂正の流暢性評価に向けたデータ作成
2022 日本語 Wikipedia の編集履歴に基づく入力誤りデータセットと訂正システムの構築
2023 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築

擬似誤り生成

キーワード/概要 Year 論文 査読 Note
2018 誤り文の自動生成による校正エンジンの学習
2020 日本語文法誤り訂正における誤り傾向を考慮した擬似誤り生成 スライド
2021 日本語文法誤り訂正におけるデータ増強および評価データ構築 スライド

分析

キーワード/概要 Year 論文 査読 Note
2012 外国語母語話者が作成する日本語技術文書を対象とした訂正履歴の分析
2013 論文作成支援のための学生論文における不適切な表現の分析
2013 Data Coverage vs. Data Size: A comparison of two large-scale corpora in Collocation Suggestion for Japanese Second Language Learners
2015 日本語校正「Project Next日本語校正タスク」
2020 日本語文法誤り訂正における最適な分割単位の調査

誤り検出

キーワード/概要 Year 論文 査読 Note
2012 複数分野の文書を用いた日本語誤り表現の検出
2014 保険関連文書を対象とした文章校正支援のための変換誤り検出
2017 マイクロブログを対象とした形態素解析誤りの自動検出と誤り分析
2019 小論文採点支援システムにおける文字誤り検出モジュールの構築
2022 日本語学習者向けの文法誤り検出機能付き作文用例検索システム
2023 BERTによる系列ラベリングを用いた文法誤り検出

システム開発

キーワード/概要 Year 論文 査読 Note
2014 第二言語学習者の作文誤り訂正タスクのためのユーザインターフェース
2016 日本語学習支援のためのコーパス構築システム
2018 Lang-8を用いた日本語学習者向けの誤用検索システムの構築
2019 日本語学習者向けの文法誤り検出機能付き誤用例文検索システム

文法誤り訂正・検出以外の学習者日本語を対象とした話題

キーワード/概要 Year 論文 査読 Note
2015 部分的アノテーションを利用したCRFによる日本語学習者文の単語分割

中国語を対象とするもの

キーワード/概要 Year 論文 査読 Note
2016 統計的機械翻訳を用いた中国語文法誤り訂正
2020 事前学習モデルを用いた中国語文法誤り訂正

ロシア語を対象とするもの

キーワード/概要 Year 論文 査読 Note
2020 言語間での転移学習を用いたロシア語文法誤り訂正

スペイン語を対象とするもの

キーワード/概要 Year 論文 査読 Note
2023 データ拡張手法を用いたスペイン語文法誤り訂正

多言語を対象とするもの

キーワード/概要 Year 論文 査読 Note
2022 言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正

関連タスク

論述リビジョン

キーワード/概要 Year 論文 査読 Note
2019 Automated Essay Rewriting (AER): Grammatical Error Correction, Fluency Edits, and Beyond
2022 論述リビジョンのためのメタ評価基盤 スライド

解説文生成

キーワード/概要 Year 論文 査読 Note
2019 英語ライティング学習支援のための前置詞誤り解説生成
2019 解説文生成研究のためのライティング技術解説付き学習者コーパス
2020 文法誤り解説文生成とはどのようなタスクなのか?
2021 仮想的な誤りタイプの割り当てによる解説文生成の性能向上
2021 英語学習者のための解説文生成手法の調査
2023 Retrieval, Masking, and Generation:マスクされた解説文を活用した文法誤り解説文生成
2023 Towards grammatically-informed feedback comments
2023 Developing a Typology for Language Learning Feedback

プロジェクト・企画など

キーワード/概要 Year リンク Note
GECアドベントカレンダー 2021 GEC (Grammatical Error Correction) Advent Calendar 2021

解説記事・学会記事など

タイトル Year Note
事前学習済みマスク言語モデルを組み合わせた符号化復号化文法誤り訂正モデル 2020
Stronger Baselines for Grammatical Error Correction Using a Pretrained Encoder-Decoder Model 2021
Do Grammatical Error Correction Models Realize Grammatical Generalization? 2021
Exploring Methods for Generating Feedback Comments for Writing Learning 2022

書籍

  • 語学学習支援のための言語処理入門

About

文法誤り訂正に関する日本語文献を収集・分類するためのリポジトリ

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published