入力システムの評価のためになんかコーパス的なものは無いかと探してたら形態素解析器 茶筌(ChaSen)というのを見つけた。 http://chasen-legacy.sourceforge.jp/ とりあえずニュース記事の見出しをありったけコピペして名詞だけ抽出したらそれなりに良い感じ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。