シェルスクリプトを使用して大規模コーパスのデータをフィルタリングする方法は? [閉鎖]

シェルスクリプトを使用して大規模コーパスのデータをフィルタリングする方法は? [閉鎖]

大規模なTwitterコーパスからツイートを抽出し、ツイートが投稿された特定の場所でフィルタリングしたいと思います。それからツイートで特定の単語を検索したいと思います。 tsvファイルのすべてのツイートを一覧表示するコマンドがあります。 $ zless location/of/tweets.out.gz | /net/corpora/twitter2/tools/tweet2tab -i user.location text

これにより、タブで区切られた次の出力が表示されます。 user.location tweet

今のツイートを一覧表示したいですlocation: Amsterdam。その後、word: halloアムステルダムのすべてのツイートを検索してください。シェルスクリプトを使用してこの問題を解決するための最良の方法は何ですか?

関連情報