Bashスクリプトのパターンに基づいて複数の文字列を抽出する

Question

サンプルデータは破損したjsonフラグメントのように見えるため、jqそれを使用して必要なものを抽出する必要があります。今後元の入力に何をしても、次のように見えます。

ただし、保持しているコンテンツからhttps://www二重引用符で始まり、それを含まないURLを抽出するには、次のようにしますgrep。

$ grep -o 'https://www[^"]*' input.txt 
https://www.mycompany.com/posts/aureliaflore_china-seoul-startup-activity-6571925510337728512-acAw
https://www.mycompany.com/posts/aureliaflore_reuters-top-news-on-twitter-activity-6571392661482233856-T3dO
https://www.mycompany.com/posts/aureliaflore_are-you-thinking-to-the-benefits-of-digitalization-activity-6570119712154451968-927T

Answer 1

サンプルデータは破損したjsonフラグメントのように見えるため、jqそれを使用して必要なものを抽出する必要があります。今後元の入力に何をしても、次のように見えます。

ただし、保持しているコンテンツからhttps://www二重引用符で始まり、それを含まないURLを抽出するには、次のようにしますgrep。

$ grep -o 'https://www[^"]*' input.txt 
https://www.mycompany.com/posts/aureliaflore_china-seoul-startup-activity-6571925510337728512-acAw
https://www.mycompany.com/posts/aureliaflore_reuters-top-news-on-twitter-activity-6571392661482233856-T3dO
https://www.mycompany.com/posts/aureliaflore_are-you-thinking-to-the-benefits-of-digitalization-activity-6570119712154451968-927T

Bashスクリプトのパターンに基づいて複数の文字列を抽出する

答え1

関連情報