ファイル内容の印刷

ファイル内容の印刷

親フォルダ、サブフォルダ、フォルダ、サブフォルダ内にファイルのリストがあります。次のコマンドラインを使用して、親フォルダとサブフォルダの内容を一覧表示します。

tree > index.txt

「index.txt」の出力は次のようになります。

.
|_ sdc
| |_ QA
| | |_  sp
| | | |_ data
| | | | | |_10507
| | | | | | |_01.txt 
| | | | | | |_02.txt           
| | | | | | |_03.zip

ファイルの1つがzipファイルの場合は、ファイル名の横に各ファイルの最初の行と2番目の行を印刷する方法可能ですか?次のように、1行目と2行目でコンテンツを印刷します。

. 
|_ sdc
| |_ QA
| | |_  sp
| | | |_ data
| | | | | |_10507
| | | | | | |_01.txt <first line> <secondline>
| | | | | | |_02.txt <first line> <secondline>
| | | | | | |_03.zip
| | | | | | | |_01.txt <first line> <secondline>
| | | | | | | |_02.txt <first line> <secondline>
| | | | | | | |_03.txt <first line> <secondline>

私はsed -n '2p;d'すべてのファイルから目的の行を印刷するのに慣れています。しかし、「tree」コマンドラインと並べて使用するにはどうすればよいですか?それとも良い提案がありますか?

答え1

この回答の終わりにあるPythonスクリプトは、目的の操作を正確には実行しませんが、近いはずです。10999目次を同じレベルに表示する方法を示すために目次を追加しました。
このコードはzipファイル内のサブディレクトリをうまく処理できないため、自分自身を再帰的に呼び出すzip_recurseルーチンを作成することをお勧めします。
コードはPython 2.6.9、2.7.9、3.3.6、3.4.2でテストされました。

$ mkdir -p sdc/QA/SP/data/10507
$ echo -e '01 line 1\n01 line 2\n01 line 3' > sdc/QA/SP/data/10507/01.txt
$ echo -e '02 line 1\n02 line 2\n02 line 3' > sdc/QA/SP/data/10507/02.txt
$ echo -e '03 line 1\n03 line 2\n03 line 3' > sdc/QA/SP/data/10507/03.txt
$ mkdir -p sdc/QA/SP/data/10999
$ echo -e '04 line 1\n04 line 2\n04 line 3' > sdc/QA/SP/data/10999/04.txt
$ pushd sdc/QA/SP/data/10507/
$ zip 03.zip *.txt
$ rm 03.txt
$ popd
$ python test.py sdc
└── QA/
    └── SP/
        └── data/
            ├── 10507/
            │   ├── 01.txt: 01 line 1\n: 01 line 2\n
            │   ├── 02.txt: 02 line 1\n: 02 line 2\n
            │   └── 03.zip
            │       └── 01.txt: 01 line 1\n01 line 2\n
            │       └── 02.txt: 02 line 1\n02 line 2\n
            │       └── 03.txt: 03 line 1\n03 line 2\n
            └── 10999/
                └── 04.txt: 04 line 1\n: 04 line 2\n

test.py:

#! /usr/bin/env python
# coding: utf-8

from __future__ import with_statement

import sys
import os
from zipfile import ZipFile

class ListTree:
    # tree characters
    indent = 2

    def __init__(self, characters=None):
        """ characters should be None for graphical, "ASCII" for non
        graphical (+|`-) or a four letter sequence
        """
        if characters is None:
            self._char = u'├│└─'
        elif characters == 'ASCII':
            self._char = '+|`-'
        else:
            self._char == characters
        assert len(self._char) == 4

    def out(self, endmarkers, val, fp=None):
        # endmarkers is a list with the length of the list indicating
        # the depth and True values if at that depth this entry is the last one
        stream = fp if fp else sys.stdout
        s = u''
        for idx, n in enumerate(endmarkers):
            if idx == len(endmarkers) - 1:
                if n:
                    s += self._char[2] + self._char[3] * self.indent
                else:
                    s += self._char[0] + self._char[3] * self.indent
            else:  # not last one
                if n:
                    s += ' ' * (self.indent + 2)
                else:
                    s += self._char[1] + ' ' * (self.indent + 1)
        msg = u'{0} {1}\n'.format(s, val)
        if sys.version_info < (3,):
            msg = msg.encode('utf-8')
        stream.write(msg)


class WalkTree(object):
    def __init__(self, base_dir):
        lt = ListTree()
        old_dir = os.getcwd()
        os.chdir(base_dir)
        for n, x in self.recurse('.'):
            lt.out(n, x)
        os.chdir(old_dir)

    def recurse(self, path, prev=[]):
        # could use os.walk() but would have to combine the dir and file_name
        # lists, sort them and split apart, or keep the lists sorted separate
        # and check from which one to take the next entry
        lst = sorted(
            [x for x in os.listdir(path) if x and not x[0] == '.'])
        lidx = len(lst) - 1
        for idx, x in enumerate(lst):
            n = prev[:] + [idx == lidx]
            dpath = os.path.join(path, x)
            if os.path.isdir(dpath):
                x += '/'
                yield n, x
                for y in self.recurse(dpath, n):
                    yield y
            else:
                if os.path.splitext(x)[1] == '.txt':
                    with open(dpath) as fp:
                        for count in range(2):
                            x += ': ' + fp.readline().replace('\n', '\\n')
                elif os.path.splitext(x)[1] == '.zip':
                    yield (n, x)
                    n1 = n[:] + [idx == lidx]
                    # ZipFile in 2.6 doesn't have __enter__/__exit__ yet
                    zf = ZipFile(dpath)
                    for info in zf.infolist():
                        x1 = info.filename
                        if os.path.splitext(x1)[1] == '.txt':
                            data = zf.read(x1)
                            if sys.version_info >= (3,):
                                data = str(data, encoding='utf-8')
                            x1 += ': ' + '\\n'.join(data.split(
                                '\n', 2)[:2]) + '\\n'
                        yield(n1, x1)
                    zf.close()
                    return
                yield (n, x)

wt = WalkTree('.' if len(sys.argv) < 2 else sys.argv[1])

関連情報