21列のみを含むFB_Dataset.csvファイルがあり、FB_Dataset.csvはカンマ区切りファイルです。 FB_Dataset.csvの全体的な構成は次のとおりです。
ファイルから「Trump」という単語への言及(大文字と小文字を無視する)と100より大きい数(列10)を抽出する必要があります。最後に、like_count(列10)でソートされたpost_id(列2)を含む新しいファイルを作成し、名前を「trump.txt」として指定します。
私はUnixに初めて触れ、2つの条件を別々に抽出する方法を見つけました。コードは次のとおりです。grep -i -o 'トランプ' FB_Dataset.csv最初の条件とawk '$10 > 100{print}' FB_Dataset.csv2番目の条件について。次は何をすべきですか?
ありがとう
答え1
私が正しく理解したら、あなたは必要です
awk -F, '/[tT]rump/ && $3>100' FB_Dataset.csv | sort -t, -k 3,3n > trump.txt
「ace」と100より大きい数字を検索し、最後に3番目の列の数字()に基づいてawk
ソートします。カンマを区切り文字として使用するには、スイッチとを使用する必要があります。sort
-k 3,3n
-F,
-t,