toroku.zip 1,464KB 2024-12-03 13:04:04
2024年11月失効反映分
独立行政法人農林水産消費安全技術センター農薬検査部(以下「薬検」という)は、2006 年 5 月から農薬登録情報を Excel 形式で公開しています。
しかし、適用データの件数が多く、Excel で扱える行数を超えてしまうため、複数のファイルに分かれており、実質上 Excel によるデータの検索は困難でした。
さらに、LZH 形式で圧縮してはいますが、トータルで 4.5MB 程度のサイズとなっています。
ブロードバンド時代とはいえ、農薬登録情報を必要とする人が多い農村部では、ISDN などのナローバンドしか使えない地域も少なからずあり、これだけのデータをダウンロードするにはかなり時間がかかりました。
このため、Excel データ提供開始直後から CSV 形式での提供をお願いしていたところ、2007 年 11 月から CSV 形式での公開も開始されました。
これにより、ダウンロード時間は、従来の Excel データの 1/4 程度まで短縮できます。
また、多くの OS が標準で対応している ZIP 形式で圧縮されているので、ダウンロード後のハンドリングも容易です。
しかし、薬検の CSV データは、データベースシステムでそのまま扱える形式ではなく、正規化が必要となります。
そこで、本サービスでは、薬検の許可をいただいて、薬検の CSV データをデータベース等で扱いやすい CSV 形式に変換して提供します。
本サービスのデータを使うと、薬検 CSV データより高速なデータベースの構築が可能となり、CRON ジョブや CGI の実行にリソース制限があるレンタルサーバ等でも扱いやすくなります。
本サービスは、下記の注意事項をご了承いただければ、個人や組織内での利用に限って、誰でも自由に無料で利用することができます。 ただし、本サービスのデータを使用したウェブ検索システム等で不特定多数が使用するような場合は、別途薬検の許諾を得る必要があります。
本サービスで提供する toroku.zip は、下記の3ファイルで構成されます。
ファイル名 | 説 明 |
---|---|
update.txt | CSV ダウンロードページのデータタイトル |
kihon.csv | 「登録基本部」の CSV を MACS 形式に変換 |
tekiyo.csv | 「登録適用部一」「登録適用部二」の CSV を MACS 形式に変換 |
toroku.zip 内のファイルの文字セットは、全て Shift_JIS です。 半角カタカナは全角カタカナに、全角「()[]」はそれぞれ半角「() []」に、さらに「@ A g b a p o s」等の機種依存文字はそれぞれ「(1) (2) L m cm cm mm kg」に変換しています。 ただし、「u」はそのまま使用しています。
なお、エンコード変換する場合、変換元の文字セットは CP932 (perl なら 'cp932'、PHP なら 'sjis-win')を指定することをお勧めします。
フィールドセパレータはカンマ(,)、レコードセパレータは CR+LF です。 DBMS の SQL 文で扱いやすい形式にしたため、一般的な CSV とは下記の点で異なります。
薬検 CSV データの更新チェックは、月〜金曜日の 10, 12, 14, 16, 18 時頃の1日5回行います。 このタイミングで薬検のデータが更新されていれば、数分後に本サービスのデータも更新されます。
このページを介さずに、プログラム等から直接 http://macs.o-ya.net/data/toroku.zip をダウンロードする場合、まず http://macs.o-ya.net/data/update.txt の HTTP レスポンスヘッダを確認してください。 ヘッダの 'Last-Modified' フィールドが以前確認した update.txt の 'Last-Modified' より新しい場合は、toroku.zip も更新されています。 update.txt にアクセスしたとき HTTP ステータスコードに 404 が返される場合は、toroku.zip は現在更新中なので、数十秒後に再アクセスしてください。