Kill one bird with two stones.

情報推薦、情報抽出を研究している大学院生の基本的にやったことのメモとか

コマンド

WikipediaのアブストラクトデータをDBに突っ込む

DBはMySQLを使う。 データのダウンロードは、 Index of /jawiki/latest/ のjawiki-latest-abstract.xmlを 右クリックメニューから保存 でダウンロードしておく。左クリックからだと設定にもよるけど、とてつもなく大きいxmlファイルを開きに行っちゃうので注…

よく使うやつ

UbuntuApacheの再起動/etc/init.d/apache2 restartCron関係 crontab -e(新規作成) tail /var/log/syslog crontabの実行ログを見る。

Wikipediaのデータをデータベースに入れる。

Wikipediaのダウンロードできるデータファイル一覧 | mwSoftここで紹介されているWikipediaのデータをデータベースに入れる方法。だいたいひとつ入れるのに1日かかるので帰る前とか時間があるときにやる方がいい。MySQL/Ubuntuを使用する。あとApache,MySQL,…