INFO 各サービスからの新着情報

2015.07.05

PC、NAS内の重複ファイルを探すためのファイル保存先情報のデータ処理

開発経緯
クライアント様から以下の要望があったため、問題解決のために開発

要望
NAS内に重複データが複数存在するため、不要なデータを削除するためのファイルの保存先情報が欲しい

解決方法
1.NASの共有フォルダをドライブとして設定し、ドライブからファイル名までの保存先情報をファイルで書き出す
2.ファイルメーカーに取り込み、「ファイル保存先情報」(dir)、「ファイル名」(file_name)、「ファイル名とその1階層上のフォルダ名」(dir1)、「ファイル名とその1階層上、2階層上のフォルダ名」(dir2)を抽出
3.必要性に応じて、dir1もしくはdir2と同じものが他にあればフラグ(f)を1、無ければ0を立てる
4.f,dir,dir2,dir1でソートをかける

上記の作業で重複されているであろうファイルを見つけることが可能になります。

今回のデータ操作において、注意した点
1.フォルダを表す「¥」は、ファイルメーカーの検索において特殊文字として認識されます。
そのため、特殊文字として認識されないように関数を工夫することが必要。
2.データ数が数万件から数十万件に及ぶため、効率良くスクリプトが働くように作成。
スクリプトを分けてループを工夫する必要がある

ファイルメーカーは、データベースを体系的に使うためだけでなく、文字列の処理にも優れています。
データ処理などでお困りのことがございましたら、是非ご相談ください。

cl_dir_list