<?xml version="1.0" encoding="UTF-8" ?>
<entry
	xmlns="http://www.w3.org/2005/Atom"
	xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/"
	xml:lang="ja-JP"
>
	<title>Sennaとかのアレの続き Tritonn編</title>
	<id>tag:txqz.net,2007-06-07:blog/2007/06/07/2026</id>
	<link rel="self" href="http://txqz.net/blog/2007/06/07/2026.atom"/>
	<link rel="alternate" type="application/rss+xml" href="http://txqz.net/blog/2007/06/07/2026.rdf"/>
	<link rel="alternate" type="application/xhtml+xml" href="http://txqz.net/blog/2007/06/07/2026.xhtml"/>
	<link rel="alternate" type="text/html" href="http://txqz.net/blog/2007/06/07/2026.html"/>
	<link rel="contents" href="http://txqz.net/blog/2007/06/07/.atom" title="2007年6月7日"/>
	<link rel="first" href="http://txqz.net/blog/2001/08/04/0001.atom" title="地球空冷化"/>
	<link rel="prev" href="http://txqz.net/blog/2007/06/03/2352.atom" title="Atom1.0仕様メモ"/>
	<link rel="next" href="http://txqz.net/blog/2007/06/07/2032.atom" title="XHTMLのContent-type"/>
	<link rel="last" href="http://txqz.net/blog/2010/02/14/1221.atom" title="VIASO/K-power追悼"/>
	<author>
		<name>陽坂智佐</name>
		<email>spambasket@txqz.net</email>
	</author>
	<content type="xhtml">
		<div xmlns="http://www.w3.org/1999/xhtml">
<p><a href="blog/2006/08/27/0253" title="CentOSにMeCab+Senna+MySQLを入れる">以前書いたMySQLにSennaを当てたときのメモ</a>が地味に注目を集めているらしく、ときたまSBMにブクマされたりしている。あのときは、お手本がDebianでパスの指定がCentOSと違っていたり、何か自分の環境で用を全うするのに必要な知識が分散していたりして無駄に時間がかかったので、一応CentOSユーザな私がやったことを一括に並べておいて、後から同じことをするのに都合の良いようにするためにあれを書いた。今は<a href="http://qwik.jp/tritonn/" title="Tritonnプロジェクト ～ MySQL+Sennaによる全文検索 ～ - Tritonnプロジェクト">Tritonn</a>があり、<a href="http://qwik.jp/tritonn/userguide.html" title="Tritonnプロジェクト ～ MySQL+Sennaによる全文検索 ～ - Tritonnの使い方">Tritonnのドキュメント</a>をそのままなぞれば (--prefixとかはちゃんと変える)、それで用が済んでしまう。</p>
<p>ちなみに、今回私がMySQLをmakeしたときのconfigureオプションはこんな感じ:</p>
<pre>./configure \
 --prefix=/usr \
 --with-charset=utf8 \
 --with-extra-charsets=complex \
 --localstatedir=/var/lib/mysql \
 --libexecdir=/var/lib/mysql/bin \
 --enable-thread-safe-client \
 --enable-local-infile \
 --enable-assembler \
 --with-pic \
 --with-fast-mutexes \
 --disable-shared \
 --with-zlib-dir=bundled \
 --with-big-tables \
 --with-yassl \
 --with-readline \
 --with-archive-storage-engine \
 --with-blackhole-storage-engine \
 --with-example-storage-engine \
 --with-federated-storage-engine \
 --with-mysql-idflags=-all-static \
 --with-client-idflags=-all-static \
 --with-mysql-idflags=-all-static \
 --with-mysql-user=mysql \
 --with-innodb \
 --with-extra-charsets=complex \
 --with-senna \
 --with-mecab \
 --with-unix-socket-path=/var/lib/mysql/mysql.sock</pre>
<p>前指定したのと、Tritonnのところに書いてあったのを重ねただけなので、これで良いのかはよく分からん。</p>
<p>それで全文検索システムをより簡単に提供できるようになった。検索用インデックスはMeCab付属のIPA辞書で事足りる。目下の問題は表示用インデックスだ。連続する名詞はひとつにまとめるとか、ちゃんと「接頭詞」とか「接尾」とかを理解するようにすれば、「緑資源開発機構」や「参院選」のような辞書にない語彙も表示できる。しかし、作品名とか略語とかはやっぱり辞書にないとうまく取り出せない。サフィックスアレイを使うって? やっぱり? 勉強しなくちゃ。</p>
<ins class="ps" datetime="2008-09-16T16:18:44+09:00" id="PS1221549524">
<p>「<a href="http://www.akiyan.com/blog/archives/2008/09/tritonnmysqlsen.html" title="Tritonn(MySQL+Senna)+Mecab+Apahce+PHPをCentOS5にインストールする : akiyan.com">Tritonn(MySQL+Senna)+Mecab+Apahce+PHPをCentOS5にインストールする</a>」も参考になる。</p>
</ins>
		</div>
	</content>
	<category term="MeCab"/>
	<category term="MySQL"/>
	<category term="Senna"/>
	<category term="SuffixArray"/>
	<category term="Tritonn"/>
	<category term="全文検索"/>
	<category term="語彙"/>
	<category term="辞書"/>
	<trackback:ping>http://txqz.net/blog/2007/06/07/2026/tb</trackback:ping>
	<published>2007-06-07T20:26:40+09:00</published>
	<updated>2008-09-16T16:18:44+09:00</updated>
	<rights>Attribution-Noncommercial-Share Alike 3.0 Unported</rights>
</entry>