COUNTIF 関数とデータ クリーニング関数は、Google スプレッドシートで重複を見つける最も簡単な 2 つの方法です。
Google スプレッドシートについて
Google スプレッドシートは、Microsoft Office と競合する完全なオフィス スイートの一部として Google が提供する、無料のクラウドベースのスプレッドシート アプリケーションです。 Google スプレッドシートでは、データの準備や計算などを行うことができます。
データの変更、整理、保存に利用されます。 Google ドキュメント生産性パッケージには、Google ドライブ、Google スプレッドシート、Google スライドで構成されるこのプログラムが組み込まれています。
ただし、Google スプレッドシートの利点の 1 つは、Excel とは異なり、他のユーザーとリアルタイムで共同で使用できることです。
Google スプレッドシートは、ユーザーフレンドリーなインターフェースとデータを整理するための実用的なツールを提供することで、データベースの作成を簡素化しました。
Google スプレッドシートを利用すると、生産性が向上し、時間を節約できます。フレームワークはクラウドベースであるため、ユーザーは重要なデータを失ったり、意図せずファイルを上書きしたりすることを心配する必要がなくなります。
最も広く使用されているスプレッドシートおよびデータベース プログラムの 1 つは Google スプレッドシートであり、すべての一般的なデスクトップおよびモバイル オペレーティング システムでアクセスできます。
Google スプレッドシートはデータベースを簡単に作成するのにどのように役立ちますか?
従来、データベースの作成は困難で時間のかかる作業でした。ただし、最近のテクノロジー、特に Google スプレッドシートの発展により、この手順は大幅に簡素化されました。このプログラムには、グラフ、数式、画像を追加する機能など、多くの機能もあります。
リアルタイムのデータ管理と保存のために、ほとんどの企業は PostgreSQL、MySQL、SQL Server などの他の高価なデータベースの代わりに Google シートを利用しています。ほとんどの小さなデータ セットは代替手段として Google シートを好みます。
Google スプレッドシートは、会社向けの包括的なデータベース管理システムではありません。ただし、他のデータベース管理システムとは異なり、小規模企業やプロジェクトが企業の財務業務を効果的に管理するのに驚異的な効果を発揮します。
重要なのは、Google Sheets API、Apps script、Form Trigger、Timed Trigger、ImportXML など、無料でアクセスできるいくつかの高度な機能を備えていることです。
アプリ スクリプトには MySQL、Microsoft SQL Server、およびその他のデータベースに接続するための JDBC サービスが含まれているため、アプリ スクリプトのユーザーはさまざまなデータベースに接続できます。
企業は、自社の機能をすべて活用することで、さまざまなデータ管理システム製品への支出を削減できます。
ここで、データベース内の重複値の影響について説明します。
データベース内の重複値の影響
データが分析またはレポート目的で使用されている場合、データベース内の重複値がデータに悪影響を与える可能性があります。
まれに、重複した値によってデータが歪められ、データから不正確な推論が行われる可能性があります。場合によっては、値が重複すると、データの使用と理解がさらに難しくなる可能性があります。
いずれの場合も、データベース内の重複値の潜在的な影響について理解し、そのような影響を防止または軽減するための予防措置を講じることが重要です。
Google スプレッドシートの重複を 1 列で強調表示する
このセクションでは、Google スプレッドシート内のデータの重複に注意を喚起し、重複を排除する方法について説明します。
重複を強調表示するために使用される一般的な式は次のとおりです。
=COUNTIF(range, criterion)
ここでは、Google スプレッドシートでこの数式を使用する方法を段階的に説明します。
以下に示すように、トップメニューの「書式」オプションに移動し、「条件付き書式設定」まで下にスクロールします。

以下に示すように、条件付き書式設定ボタンをクリックすると、右側に新しい条件付き書式設定オプションが表示されます。

重複を強調表示するセル範囲を定義した後、上の例に示すように、[形式ルール] セクションまで下にスクロールし、ドロップダウン メニューから [カスタム数式は] オプションを選択します。
このフィールドに、次の式を入力します。
=COUNTIF($G$6:$G$14,G6)>1
G セルは、重複を強調表示する必要性に基づいて適切な列に置き換える必要があります。
[完了] ボタンをクリックすると、上の画像に示すように、列の重複が強調表示されます。

以下に示すように、書式スタイルの設定を通じて、強調表示の色やその他の書式オプションを変更できます。

上の例では、単一の列から重複を強調表示する方法を説明しました。
以下のセクションでは、複数の列の重複を強調表示する方法を説明します。
Google スプレッドシートで複数の列の重複を強調表示する
このプロセスのすべてのフェーズは、重複を強調表示するために定義した数式とセル範囲を除いて、上で説明したものと同じになります。
それをよりよく理解するために、1 つの例を使用してみましょう。
「書式」ナビゲーションメニューから「条件付き書式設定」オプションに移動して、数式を実行します。以下の図に示すように、オプションが右側に表示されます。
「範囲に適用」セクションでセル範囲を指定します。
「書式ルール」セクションでは、複数の列の重複を強調表示するために使用される式は次のとおりです。
=COUNTIF($F$6:$I$8,F6)>1
これは非常に単純な式であり、実装も簡単です。数式には、重複を特定する必要があるセル範囲のみが含まれています。
この数式を実行すると、以下の例に示すように、4 つの列の重複が強調表示されます。
この図では、ハイライトの色も青に変更しています。

次のセクションでは、行から重複データを強調表示する方法を検討します。
Google スプレッドシートの重複を行ごとにハイライト表示する
Google シートでは、データの重複行を特定することは、重複する列を強調表示することとは少し異なります。
式以外はすべて同じなので、各ステップを繰り返しません。
一例を挙げてみましょう。
以下の図に示すように、重複を強調表示するセル範囲は、条件付き書式オプションの [範囲に適用] 部分にリストされます。
「カスタム数式は」セクションに入力された数式は次のとおりです。
=COUNTIF(ARRAYFORMULA($A$3:$A$10&$B$3:$B$10&$C$3:$C$10),$A3&$B3&$C3)>1
この数式は複雑に見えますが、重複を強調表示する行の開始セル番号と終了セル番号で構成されていることに注意してください。
この式を実行すると、以下のように結果が表示されます。
この図では、強調表示の色も変更されています。これは、重複した列を強調表示する場合と書式設定スタイル メニューの同じ部分で可能です。

Google スプレッドシートで特定の条件の重複をハイライト表示する
特定の条件に基づいて重複を強調表示する場合は、スター演算子 (「*」) を使用して、定義された両方の範囲をリンクし、結果を表示するように COUNTIF 関数に指示する必要があります。
上記の条件を実行するための数式構文は次のようになります。
=(COUNTIF(Range,Criteria)>1) * (New Condition) )
それを理解するために一例を挙げてみましょう。
基準: 重複行の最初のエントリをそのままにして、データベース内のすべての重複行を強調表示したいとします。
Google スプレッドシートでそれを行う方法を見てみましょう。式の変更を除いて、すべての段階は他のアプローチで上で説明したものと同じなので、直接に入りましょう。
上記の基準を実行するための式は次のとおりです。
=COUNTIF(ArrayFormula($A$3:$A3&$B$3:$B3&$C$3:$C3),$A3&$B3&$C3)>1
一見複雑で長い式には、セル番号の開始と終了が含まれます。
以下の Google シートは、最初の Apple と Orange のエントリがスキップされ、最後のエントリが強調表示されていることを示しています。

ここまで、行、列、および特定の条件で重複データを強調表示する方法を見てきました。
次のセクションでは、ショートカットを使用して重複データを削除する方法を簡単に説明します。
重複を削除するショートカット
下の図に示すように、重複レコードを削除するデータベースまたは列を選択し、上部のメニューから「データ クリーンアップ」を選択し、「重複の削除」まで下にスクロールして、「OK」をクリックします。

下の図に示すように、[重複の削除] をクリックすると、代替案を選択し、重複の削除を承認するためのポップアップ ボックスが表示されます。
以下の画像に示すように、「ヘッダー行としてのデータ」の選択があります。シートにヘッダー行がある場合、このチェックボックスをオンにすると、重複を削除するときに Google シートでヘッダー行が無視されます。

選択を確認して「重複を削除」ボタンをクリックすると重複が削除され、以下のステータスが表示されます。

一意のリストを作成するにはどうすればよいですか?
多数の重複があるデータベースから個別のリストを抽出してみましょう。
この公式は非常に簡単に理解して適用できます。
これを理解するために、以前の Google スプレッドシートを見てみましょう。
一意のリストを作成する構文は次のとおりです。
=unique(range start: range end)
以下の図に示すように、D 列に数式が設定され、一意のデータを抽出するセル範囲が定義され、実行後の結果が D 列に表示されます。
Googleスプレッドシートの空白を削除するにはどうすればよいですか?
テキストまたは数値データを含む Google スプレッドシートで作業していると、セル内に過剰なスペースが頻繁に発生して迷惑になります。
このパートでは、これらの追加の空白を削除する方法を見ていきます。
以下の Google スプレッドシートを使用して、余分な空白を削除してみましょう。
以下に表示されているように、追加の空白がある列またはデータのセットを選択し、上部の [データ メニュー] に移動し、[データ クリーンアップ] まで下にスクロールして、[空白のトリミング] をクリックします。

「空白のトリミング」を選択すると、下の図に示す結果が表示されます。ご覧のとおり、列には余分な空白がなくなりました。

最後の言葉
データの重複は、不必要な時間の無駄であるだけでなく、重大な問題やコストのかかるエラーを引き起こす可能性もあります。
Google シートのサイズが小さい場合は手動で見つけることができますが、シートが多数ある場合は時間がかかり、エラーが発生しやすくなります。上記のテクニックは、Google ドキュメント内の重複を特定し、それらをすべて一度に削除するのに役立ちます。
次に、Google スプレッドシートの究極の FAQ チートシートをご覧ください。