Kill one bird with two stones.

情報推薦、情報抽出を研究している大学院生の基本的にやったことのメモとか

備考禄

WikipediaのアブストラクトデータをDBに突っ込む

DBはMySQLを使う。 データのダウンロードは、 Index of /jawiki/latest/ のjawiki-latest-abstract.xmlを 右クリックメニューから保存 でダウンロードしておく。左クリックからだと設定にもよるけど、とてつもなく大きいxmlファイルを開きに行っちゃうので注…

Wikipediaのデータをデータベースに入れる。

Wikipediaのダウンロードできるデータファイル一覧 | mwSoftここで紹介されているWikipediaのデータをデータベースに入れる方法。だいたいひとつ入れるのに1日かかるので帰る前とか時間があるときにやる方がいい。MySQL/Ubuntuを使用する。あとApache,MySQL,…