すべてのファイルで、他の文字列の後に続くすべての文字列を見つけます。

Question 1

ログインと値を常に空白なしで二重引用符で囲むと仮定すると、これはgrepとcountの構成です。

grep -o 'login":"[^"]*"' * | cut -d'"' -f3 | sort | uniq -c

これにより、複数回発生したログインのリストが生成されます。

これに基づいて、必要なjson形式を設定する必要があります。sedあなたのためにこれを行うことができます：

| sed '1i{
       s/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/;$a}'

これによりチャンクの開始と終了がsed配置され、出力が目的のjson形式に変更されます。{}uniq

UPD：最終コマンドは次のようになります。

grep -o 'login":"[^"]*"' * | cut -d'"' -f3 | sort | uniq -c | sed '1i{
       s/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/;$a}' > file.txt

Answer

ログインと値を常に空白なしで二重引用符で囲むと仮定すると、これはgrepとcountの構成です。

grep -o 'login":"[^"]*"' * | cut -d'"' -f3 | sort | uniq -c

これにより、複数回発生したログインのリストが生成されます。

これに基づいて、必要なjson形式を設定する必要があります。sedあなたのためにこれを行うことができます：

| sed '1i{
       s/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/;$a}'

これによりチャンクの開始と終了がsed配置され、出力が目的のjson形式に変更されます。{}uniq

UPD：最終コマンドは次のようになります。

grep -o 'login":"[^"]*"' * | cut -d'"' -f3 | sort | uniq -c | sed '1i{
       s/\s*\([0-9]*\)\s*\(.*\)/"\2": \1,/;$a}' > file.txt

Question 2

すべてのユーザー名、つまり次にlogin関連するすべての文字列を取得します。正しい形式のJSONドキュメント、文書構造を知らない:

jq -r '..|select(.login?).login' file.json

これを複数のJSONファイルに適用し、結果を並べ替えて計算します。

jq -r '..|select(.login?).login' *.json | sort | uniq -c

ここで使用される表現jqは

..：すべてのキーと値を再帰的に巡回します。
select(.login?)：キーを含む見つかったオブジェクトを選択しますlogin。
.login：キーの値を取得します。

jq上記の表現に基づいて、希望する辞書は次のとおりです。

jq -sr '[..|select(.login?).login]|group_by(.)|map({key:.[0],value:length})|from_entries' *.json

テスト：

$ cat file.json
{"this":"is", "A":{"login":"username2"}, "type":{"of":"object", "but":"please"},
 "go":"withit", "login":"me"}

$ jq -sr '[..|select(.login?).login]|group_by(.)|map({key:.[0],value:length})|from_entries' file.json
{
  "me": 1,
  "username2": 1
}

同じファイルを2回提供します。

$ jq -sr '[..|select(.login?).login]|group_by(.)|map({key:.[0],value:length})|from_entries' file.json f
ile.json
{
  "me": 2,
  "username2": 2
}

単一ラインのコンパクトな出力を得るには、jqwithを使用します。-c

サンプルファイルの場合、jq -sr '[..|select(.login?).login]' file.json次のものが生成されます。

[
  "me",
  "username2"
]

これでgroup_by(.)与えられる

[
  [
    "me"
  ],
  [
    "username2"
  ]
]

このmap({key:.[0],value:length})セクションでは、以下を提供します。

[
  {
    "key": "me",
    "value": 1
  },
  {
    "key": "username2",
    "value": 1
  }
]

最後に、from_entries最終結果が提供されます。

Answer