|
先月、薬検に再度 CSV + ZIP 形式でのデータ提供をお願いしましたが、今度はほかにも要望はあるがいちいち対応できないという返事でした。CSV で提供すると書いてあるにもかかわらず、まったくやる気はなさそうです。
しょうがないので、XREA の CRON ジョブで、自動的に
(1) 更新された XLS+LZH のダウンロード
(2) LZH の解凍
(3) XLS->CSV 変換
(4) CSV の ZIP 圧縮
をやらせようと思い、ここ1か月ほどいろいろ試してました。(1), (2), (4) は簡単にできたんですが、XLS ファイルがでかすぎるせいで (3) がどうしてもうまく行きません。perl の Spreadsheet::ParseExcel は時間がかかりすぎてダメ(XREA の時間制限内で処理できない)。PHP の Excel_Reader は、perl の ParseExcel よりは速いけど条件によって時間制限にひっかかることがあるのと、XREA のメモリ制限からかうまく読めない場合があってやはりダメ。gcc でコンパイルされた xlhtml なら使えるかなと思ったんですが、変換時間は高速ですが、登録適用部二・三のデータが正常に読めない(XREA のメモリ制限によるものか、あるいは xlhtml の仕様によるものか?)。
…ってことで、今のところ八方ふさがりです。とりあえず、PHP でメモリを使わない専用リーダーを作成中ですが、道のりは遠そうです。
>s_kobayashi さん
メモリが自由に使える環境で、xlhtml 0.5 で 登録適用部二.xls, 登録適用部三.xls が HTML に正常に変換できるかどうかご確認いただけませんか?
|
|