ファイル数に応じてzipアーカイブを作成する

ファイル数に応じてzipアーカイブを作成する

Sun OS 5.8

ディレクトリ構造

/テスト/chm

CHM
   A
     file1.txt
     file2.txt
   B
     file3.txt
   C
     file4.txt
     file5.txt
     file6.txt

親ディレクトリCHMに8つ未満のファイル/サブディレクトリがある場合、圧縮は正常です。親ディレクトリCHMに8つ以上のファイル/サブディレクトリがある場合は、5つのファイルのzipアーカイブを作成します。これはテストにのみ使用されます。本番では、5つではなく10,000個のファイルになります。親ディレクトリCHMには0からn個のサブディレクトリがあります。

#!/bin/bash
set -e

cd $subdir/

# vars
num=8  # set 10000 in production

for dir in $subdir
do
    dir=${dir%*/}

    # testing code only
          if [[ ${dir##*/} = "CHM" ]]
          then
                numfile=$(ls * | wc -l)
          fi

          if [ "$numfile" -lt "$num" ]
          then
               zip -r -6 ${dir##*/}.zip .
          else
               ls * > files
               split -l 5 - files < files
               for i in files[a-z][a-z]; do
                   zip -6 "$i.zip" -@ < "$i"
               done
          fi
    # end test
done
exit


   zip warning: name not matched: A:
   zip warning: name not matched: file1.txt
   zip warning: name not matched: file2.txt
   zip warning: name not matched: B:

zip error: Nothing to do! (filesaa.zip)

2番目のifステートメントのelse部分が失敗する理由を知りません。私は以下を作成しようとしています:

CHM.zip master
CHM.001.zip
CHM.002.zip
CHM.003.zip

そのため、リモートサーバーで同じ順序で解凍できます。

答え1

あなたのルールに正確に従ったことを完全に確信することはできませんが、標準ユーティリティを使用する方が簡単です(そして何をいつ作成するかについてのルールを単純化します)。

find . -type f | split -d -a3 -l $num --filter='zip -@ $FILE.zip' - "$pfx".

findかなり当然です。必要に応じてオプションを調整してください。出力をに渡す前にリストを並べ替えることができますsplit

split:

  • - d- 文字サフィックスの代わりに数字を使用してください。
  • -a3- サフィックス長(数字)3桁(この例では数字)
  • -l- カウンター増加後の行数
  • --filter=COMMAND- ファイルに書き込むのではなく、コマンドに行を渡します。
  • COMMAND- 通常、書き込みに使用されるファイル名$FILEとして解釈されますsplit。つまり、単一引用符(または上記のコマンドラインを実行するシェルの解釈を防ぐためにバックスラッシュ)で囲む必要があります。
  • -- 標準入力の解析を明示的に要求します。
  • "$pfx".好ましいプレフィックス。ポイントは意図的なものであり、split自動的につくことはありません。

答え2

Sun Solaris用のソリューションがあります。これにより、マルチパートzipごとに10000個のファイルが圧縮され、デフォルトのzipがリモートサーバーにscpされます。

#!/usr/bin/env bash
#
#------------------------------------------------------------
#-- Zip up content files based on $1 parameter
#------------------------------------------------------------
function zip_files {
   SRC="/ads/data02/CTS/Data/$1"
   #-- destination folder
   DST="/ads/acct/oracle/CTS"
   #-- amount of files that should go in each zip file
   FILES_PER_ZIP=10000

#-----------------------------------------------------------

  FILES="/tmp/multizip.$$"
  ZIP_PREFIX=$(basename $SRC)

#-- generate the list of the files to zip
  find $SRC > $FILES

#-- zip the files
  NUM=0
  ZIP_NUM=1
  printf -v ZIPFILE "$DST/$ZIP_PREFIX%03d" $ZIP_NUM
  while read -r line; do
    echo $line | sed -e 's/.*/"&"/' | xargs zip -6 $ZIPFILE
    ((NUM++))
    if [ $NUM -eq $FILES_PER_ZIP ]; then
       NUM=0
       ((ZIP_NUM++))
       printf -v ZIPFILE "$ZIP_PREFIX%03d" $ZIP_NUM
    fi
done < $FILES

#-- generate master zip file
/usr/bin/ls $DST/${ZIP_PREFIX}*.zip | xargs zip $DST/$ZIP_PREFIX

#-- perform cleanup

   function finish {
     /usr/bin/rm $FILES
     /usr/bin/rm /ads/acct/oracle/CTS/${ZIP_PREFIX}[0-9][0-9][0-9].zip
   }

   trap finish EXIT
}


#------------------------------------------------------------
#-- Main processing
#------------------------------------------------------------

for dir in /ads/data02/CTS/Data/*/
do
    d=$(basename $dir)
    zip_files $d
    scp "/ads/acct/oracle/CTS/${d}.zip" [email protected]:/var/www/html/CTS/Content/A/TMP
    /usr/bin/rm -f "/ads/acct/oracle/CTS/${d}.zip"
done
exit

関連情報