親フォルダ、サブフォルダ、フォルダ、サブフォルダ内にファイルのリストがあります。次のコマンドラインを使用して、親フォルダとサブフォルダの内容を一覧表示します。
tree > index.txt
「index.txt」の出力は次のようになります。
.
|_ sdc
| |_ QA
| | |_ sp
| | | |_ data
| | | | | |_10507
| | | | | | |_01.txt
| | | | | | |_02.txt
| | | | | | |_03.zip
ファイルの1つがzipファイルの場合は、ファイル名の横に各ファイルの最初の行と2番目の行を印刷する方法可能ですか?次のように、1行目と2行目でコンテンツを印刷します。
.
|_ sdc
| |_ QA
| | |_ sp
| | | |_ data
| | | | | |_10507
| | | | | | |_01.txt <first line> <secondline>
| | | | | | |_02.txt <first line> <secondline>
| | | | | | |_03.zip
| | | | | | | |_01.txt <first line> <secondline>
| | | | | | | |_02.txt <first line> <secondline>
| | | | | | | |_03.txt <first line> <secondline>
私はsed -n '2p;d'
すべてのファイルから目的の行を印刷するのに慣れています。しかし、「tree」コマンドラインと並べて使用するにはどうすればよいですか?それとも良い提案がありますか?
答え1
この回答の終わりにあるPythonスクリプトは、目的の操作を正確には実行しませんが、近いはずです。10999
目次を同じレベルに表示する方法を示すために目次を追加しました。
このコードはzipファイル内のサブディレクトリをうまく処理できないため、自分自身を再帰的に呼び出すzip_recurseルーチンを作成することをお勧めします。
コードはPython 2.6.9、2.7.9、3.3.6、3.4.2でテストされました。
$ mkdir -p sdc/QA/SP/data/10507
$ echo -e '01 line 1\n01 line 2\n01 line 3' > sdc/QA/SP/data/10507/01.txt
$ echo -e '02 line 1\n02 line 2\n02 line 3' > sdc/QA/SP/data/10507/02.txt
$ echo -e '03 line 1\n03 line 2\n03 line 3' > sdc/QA/SP/data/10507/03.txt
$ mkdir -p sdc/QA/SP/data/10999
$ echo -e '04 line 1\n04 line 2\n04 line 3' > sdc/QA/SP/data/10999/04.txt
$ pushd sdc/QA/SP/data/10507/
$ zip 03.zip *.txt
$ rm 03.txt
$ popd
$ python test.py sdc
└── QA/
└── SP/
└── data/
├── 10507/
│ ├── 01.txt: 01 line 1\n: 01 line 2\n
│ ├── 02.txt: 02 line 1\n: 02 line 2\n
│ └── 03.zip
│ └── 01.txt: 01 line 1\n01 line 2\n
│ └── 02.txt: 02 line 1\n02 line 2\n
│ └── 03.txt: 03 line 1\n03 line 2\n
└── 10999/
└── 04.txt: 04 line 1\n: 04 line 2\n
test.py
:
#! /usr/bin/env python
# coding: utf-8
from __future__ import with_statement
import sys
import os
from zipfile import ZipFile
class ListTree:
# tree characters
indent = 2
def __init__(self, characters=None):
""" characters should be None for graphical, "ASCII" for non
graphical (+|`-) or a four letter sequence
"""
if characters is None:
self._char = u'├│└─'
elif characters == 'ASCII':
self._char = '+|`-'
else:
self._char == characters
assert len(self._char) == 4
def out(self, endmarkers, val, fp=None):
# endmarkers is a list with the length of the list indicating
# the depth and True values if at that depth this entry is the last one
stream = fp if fp else sys.stdout
s = u''
for idx, n in enumerate(endmarkers):
if idx == len(endmarkers) - 1:
if n:
s += self._char[2] + self._char[3] * self.indent
else:
s += self._char[0] + self._char[3] * self.indent
else: # not last one
if n:
s += ' ' * (self.indent + 2)
else:
s += self._char[1] + ' ' * (self.indent + 1)
msg = u'{0} {1}\n'.format(s, val)
if sys.version_info < (3,):
msg = msg.encode('utf-8')
stream.write(msg)
class WalkTree(object):
def __init__(self, base_dir):
lt = ListTree()
old_dir = os.getcwd()
os.chdir(base_dir)
for n, x in self.recurse('.'):
lt.out(n, x)
os.chdir(old_dir)
def recurse(self, path, prev=[]):
# could use os.walk() but would have to combine the dir and file_name
# lists, sort them and split apart, or keep the lists sorted separate
# and check from which one to take the next entry
lst = sorted(
[x for x in os.listdir(path) if x and not x[0] == '.'])
lidx = len(lst) - 1
for idx, x in enumerate(lst):
n = prev[:] + [idx == lidx]
dpath = os.path.join(path, x)
if os.path.isdir(dpath):
x += '/'
yield n, x
for y in self.recurse(dpath, n):
yield y
else:
if os.path.splitext(x)[1] == '.txt':
with open(dpath) as fp:
for count in range(2):
x += ': ' + fp.readline().replace('\n', '\\n')
elif os.path.splitext(x)[1] == '.zip':
yield (n, x)
n1 = n[:] + [idx == lidx]
# ZipFile in 2.6 doesn't have __enter__/__exit__ yet
zf = ZipFile(dpath)
for info in zf.infolist():
x1 = info.filename
if os.path.splitext(x1)[1] == '.txt':
data = zf.read(x1)
if sys.version_info >= (3,):
data = str(data, encoding='utf-8')
x1 += ': ' + '\\n'.join(data.split(
'\n', 2)[:2]) + '\\n'
yield(n1, x1)
zf.close()
return
yield (n, x)
wt = WalkTree('.' if len(sys.argv) < 2 else sys.argv[1])