[前途多難]テキスト抜き出し
WEBページからテキストを抽出して形態素解析にかけるには
テキスト抜き出しをしなければなりません。
タグを削除する
単純にタグを消すだけでも良いのですが、
↑に説明があるように、HTML::To ...
さくらインターネットでTermExtractを使ってみる
さくらインターネットでTermExtractが使えるかどうか試してみました。
cpanmを使ってインストールしました。
cpanmperlモジュールのinstallにcpanmを使う
さくらインター ...
TermExtractインストールするも、まったく動作しなかった
Mecabだとキーワードが細切れになってしまいます。
名詞と名詞をつなげるというようなカスタマイズもありですが、
自動的につなげてくれるモジュールがあるようです。
共起語ツールの作成
関連後やサジェストを調べると記事作成がはかどります。
と言うか、SEO的にも良い記事が出来上がる・・・ような気がする。
共起というのは、
共起(きょうき)は、ある単語がある文章(または文)中 ...
自動更新ブログの実験
自動更新でブログを作ると、高い確率でスパム認定されてしまうみたい。
でも、有用なコンテンツでもダメなのか?って言う疑問はありますね。
でも、なかなか日々一刻と変わる情報を自動投稿って簡単じゃありません。