Windowsを使用して以来、私はファイルシステムのアーカイブコピーとシステムとデータドライブのアーカイブを大量に蓄積してきました。価値がないかもしれないものはすべて捨てて、蒸留して役に立つ部分にしようと努力します。
上記のファイルの束がコピーされている間にスクロールして保存ドライブから作業ドライブに移動するのを見ると、「良い」ファイルと「無駄な」ファイルの開始リストがあるようですが、そこにいるかどうか疑問に思います。信頼できる種類のファイルのリスト(以前のWindows環境では)は役に立たないため、すぐに削除する必要がありますか?
受賞者:(このリストを包括的に作成しようとすると台無しになる可能性があることがわかっているので、誤って台無しになる可能性があるゴミに囲まれていない限り、このリストは私が探しているものではありません。)(編集:唯一の方法が非常に包括的なホワイトリストベースのアプローチである場合は、そうします。そうでなければいいのですが、乞食はセレクタになることはできません...ほとんどの場合。)
*.tar.*, *.rar, *.zip
*.mp(e)g, *.avi, *.mkv, *.wmv, *.asf
失敗者: (これは私が本当に欲しいものです)
*.exe, *.bat, *.dll, *.com, *.lnk
また、例外があるということも知っています。 Wineに何かをインストールするために使用されるインストーラ.exeファイルと同じです。この質問の目的のために、そのような懸念は問題ではありません。問題のすべてのファイルはコピー(コピー、おそらくより多くのコピー)なので、私が本当に保存したいインストーラは安全で書き込み禁止の場所にあります。
答え1
あなただけがあなたが必要とするもの/保有したいことが何であるかを知っています。しかし、次のようにすることができます。ある程度は、Windowsシステムファイルと他のインストール済みプログラムファイルを識別します。
仮想マシンにWindowsとこれらのプログラムを再インストールし、2つのリストを作成します。みんな仮想マシンのファイル名。
VM で新しくインストールされたシステムの最初のリストを作成します。
dir /S /B /A-D C:\ >vmlist.1
VMで更新されたシステムの2番目のリストを作成します。
dir /S /B /A-D C:\ >vmlist.2
* nixに戻り、2つのファイルをマージして重複した行を削除します。
sort -u vmlist.1 vmlist.2 >vmlist
今リストは次のようになります(もちろん長いですが)。
C:\name with 6 special chars [$.^|]
C:\Windows\System32\asr_fmt.exe
C:\Windows\System32\asr_ldm.exe
C:\Windows\System32\asr_pfu.exe
リストを
regex
適切なスキーマに変換します。grep
sed -r 's/\\/\//g; s/[]$.^|[]/\\&/g; s/^[[:alpha:]]:/^.*/; s/$/$/' vmlist >vmlist.rex
正規表現のリストは次のとおりです。
^.*/name with 6 special chars \[\$\.\^\|\]$
^.*/Windows/System32/asr_fmt\.exe$
^.*/Windows/System32/asr_ldm\.exe$
^.*/Windows/System32/asr_pfu\.exe$
ターゲットアーカイブディレクトリに含まれるファイルの一覧表示
find '/my/archive/dir' -type f >arclist
今一つ作るサブリスト
arclisl
正規表現パターンに一致するファイルから。<arclist grep -f vmlist.rex >arcmatches
arcmatches
一致するWindowsファイルが含まれています。確認して満足している場合は削除してください。削除コマンドです。<arcmatches xargs -d'\n' rm -v
答え2
おそらくジャンクを削除する最も簡単な方法は、作成日または最後の修正日に基づいていることです(どちらが良いか実験する必要があるかもしれません)。システムのインストール日を開始点として使用します。
パレートの原理によれば、簡単なフィルタで目的の結果の80%を得ることができます。
(もちろん、このリストをすでに収集し始めたモノクロリストと組み合わせることができ、組み合わせる必要があります。)
答え3
thumbs.db
私が知る限り、このファイルはUnix系システムでは役に立ちません。
Windows システムでイメージのサムネイルをキャッシュするために使用される (隠された) ファイル。フォルダ内の画像を表示すると、各画像フォルダには独自の画像があるため、thumbs.db
画像フォルダの数によっては、ハードドライブにこれらの画像がかなりある可能性があります。
すべての*nixがサムネイルをどのように処理するかはわかりませんが、少なくとも私の場合(Ubuntu / GNOME)、すべてのサムネイルはデフォルトで1つの場所に保存されます。私のホームディレクトリのフォルダ(like.thumbnails/
とサブフォルダも含む)。そのため、WindowsからLinuxに移動したときにこのファイルをすべて削除しました。.thumbnails/normal
.thumbnails/large
thumbs.db
答え4
C:/pagefile.sys
C:/のルートディレクトリにあるpagefile.sysは、もはや不要になったかなり大きなファイルでなければなりません。
ほとんどの場合、エミュレータ、仮想マシンを使用しない限り、Windows-Dir全体は役に立ちません。
フォント(少なくとも*.ttf/*.TTF)は例外です。