オンラインデーティングマッチのデータ事実
Yulu Jiang
2024/06/25
データセットについて
出典:Kaggle
AIデータ分析はPowerdrill AIによって提供されています。
今日は、オンラインデーティングマッチデータセットを予測するという興味深いデータセットを見つけました。これには、オンラインデーティング行動に関する1000件の匿名データが含まれているため、powerdrill.aiを使用してさらに分析しました。
関連する調査
VIPメンバーシップにおける性別の違い:VIPメンバーシップを購入する男性と女性の割合に有意差はありますか?
収入とVIPメンバーシップ:収入レベルとVIPメンバーシップを購入する可能性の間に相関関係はありますか?
年齢とマッチ:年齢はユーザーが受け取るマッチの数にどのように影響しますか?
魅力とマッチ:ユーザーの魅力評価と受け取るマッチの数の間には関係がありますか?
子供とオンラインデーティング行動:子供がいることはマッチの数やVIPメンバーシップを購入する可能性にどのように影響しますか?
収入分布:ユーザーの収入分布はどのようになっていますか?また、性別によってどのように異なりますか?
年齢分布:ユーザーの年齢分布はどのようになっていますか?また、性別によってどのように異なりますか?
魅力評価:ユーザーの魅力評価の分布はどのようになっていますか?また、年齢や収入などの他の変数との相関関係はどうですか?
VIPメンバーシップとマッチ:VIPメンバーシップを持つユーザーは、持たないユーザーに比べてマッチをより多く受け取りますか?
人口統計プロファイル:VIPメンバーシップを最も購入しやすいユーザーの人口統計プロファイル(年齢、収入、子供)とは何ですか?
これらの調査は、オンラインデーティングの文脈におけるユーザー行動や好みを理解するのに役立ちます。それでは結論を見てみましょう。
1. VIPメンバーシップを購入する男性と女性の割合に有意差はありますか?
VIPメンバーシップ購入における性別の違い:
女性のVIP購入割合:
47.65% の女性がVIPメンバーシップを購入しています。
男性のVIP購入割合:
47.14% の男性がVIPメンバーシップを購入しています。
統計的有意性:
性別によるVIPメンバーシップ購入の違いは 有意ではありません、女性の47.65%と男性の47.14%の近い割合と、Yes_VIP_Percentage列の低い標準偏差(std=0.36)が示しています。
全体的な洞察:
両方の性別は、VIPメンバーシップを購入する傾向において類似しており、女性が男性よりもわずかに購入する可能性が高いですが、差はわずかです。
2. 収入レベルとVIPメンバーシップを購入する可能性の間に相関関係はありますか?

提供された文脈と視覚化された分析データに基づいて、収入レベルとVIPメンバーシップを購入する可能性の相関について以下の結論が導かれます:
相関分析:統計データは、収入レベルとVIPメンバーシップを購入する可能性の間にわずかな負の相関があることを示しています。PurchasedVIPに対して'No'という回答をした個人の平均収入(51,175.20ドル)は、'Yes'という回答をした人の平均収入(50,781.21ドル)よりわずかに高いです。
視覚的表現:ボックスプロットの視覚化は、VIPメンバーシップを購入していない人の中央値の収入が購入している人よりわずかに高いことを示しており、両グループの四分位範囲(IQR)は非常に小さいため、各グループ内の変動性が低いことを示唆しています。
収入の違い:両グループ間の平均収入の違いは393.99ドルで、全体の収入レベルに比べて比較的小さいです。これは、収入がVIPメンバーシップ購入の強い予測因子ではない可能性があることを示唆しています。
強調された重要点:
VIPメンバーシップ購入との間に微弱な負の相関があります。
非VIP会員の平均収入はわずかに高いです。
VIPグループと非VIPグループ内の収入の変動性は低いです。
グループ間の収入の違いは最小限であり、他の要因がVIPメンバーシップ購入の決定に影響を与えている可能性が示唆されています。
3. 年齢はユーザーが受け取るマッチの数にどのように影響しますか?

提供されたデータと年齢と平均マッチ数の関係の視覚化に基づいて、以下の結論が導かれます:
マッチ数の変動性:平均マッチ数は異なる年齢グループで大きく変動します。
若年層および中年層でのマッチのピーク:年齢層 18-24 および 30-34 は、平均マッチ数がそれぞれ 81.52 および 82.78 と最も高くなります。
30代後半でのマッチの減少: 35-39 の年齢層は平均マッチ数が顕著に減少し、最低の平均値は 68.98 です。
40代前半でのマッチの回復: 40-44 の年齢層では平均マッチ数が 78.29 に増加します。
4. ユーザーの魅力評価と受け取るマッチの数との関係は何ですか?

提供された文脈と散布図の視覚化に基づいて、魅力とマッチの関係について以下の結論が導かれます:
相関関係:'魅力'と'マッチ'の相関係数は 0.31 であり、これは 正の弱い関係を示しています。これは、魅力評価が高くなるにつれてマッチの数も増える傾向があることを示唆していますが、他の要因もマッチ数を決定する際に重要な役割を果たす可能性があります。
データ分布:平均魅力評価は 5.62 で、標準偏差は 2.82 です。また、平均マッチ数は 76.05 で、標準偏差は 52.71 です。これは、魅力とマッチの両方について幅広い値の範囲を示しています。
散布図分析:散布図は、魅力評価が高くなるにつれてマッチ数が増える傾向を示しています。ただし、魅力評価が高いにもかかわらず、マッチ数が少ないまたはゼロの個人や、逆に魅力評価が低いのに多くのマッチを受け取る個人も存在します。
外れ値と異常値:散布図は、魅力評価が高いが予想外にマッチ数が少ない個人や、魅力評価が低いのに多くのマッチを受け取る個人を示す外れ値や異常値を明らかにするかもしれません。これらのケースは、魅力だけではなく、マッチ数に影響を与えるダイナミクスを理解するためのさらなる調査の対象となる可能性があります。
結論:魅力とマッチの間には正の相関があるものの、関係は強くなく、ユーザーが受け取るマッチ数に影響を与える他の要因がある可能性があります。データは、魅力がプラットフォーム上のマッチプロセスに影響を与える複数の要因の一つであることを示唆しています。
5. 子供がいることはマッチの数およびVIPメンバーシップを購入する可能性にどのように影響しますか?

子供がいることがマッチの数に与える影響
提供されたデータに基づき、ユーザーが受け取るマッチの平均数に対する子供の有無の影響は次のようにまとめられます:
子供がいないユーザー の平均は 76.02マッチ です。
子供が1人いるユーザー の平均は 74.76マッチ でわずかに低くなります。
子供が2人いるユーザー の平均は 75.71マッチ で少し増加します。
子供が3人いるユーザー の平均は 80.83 で最も高いマッチ数を体験します。
データは、3人の子供 がいるユーザーが最も多くのマッチを受け取る傾向があることを示していますが、1人の子供がいるユーザーは最も少ないマッチを受け取ることになります。ただし、グループ間の平均マッチ数の違いは比較的小さいため、子供の数はマッチ数に対して 控えめな影響 をもたらしています。

子供がいることがVIPメンバーシップを購入する可能性に与える影響
子供の数に基づくVIPメンバーシップを購入する可能性の分析は以下の通りです:
子供がいないユーザー のVIPメンバーシップ割合は 0.487864 (48.79%) です。
子供が1人いるユーザー の割合は 0.469388 (46.94%) でわずかに低くなります。
子供が2人いるユーザー の割合は 0.429293 (42.93%) で最低です。
子供が3人いるユーザー はVIPメンバーシップを購入する可能性が最も高く、割合は 0.520833 (52.08%) です。
この傾向は、子供が3人いるユーザーがVIPメンバーシップを購入する可能性が最も高いことを示唆していますが、子供が2人いるユーザーは最も購入の可能性が低いです。VIPメンバーシップの割合の変動は、ユーザーが持つ子供の数がVIPメンバーシップを購入する決定に 顕著な影響 を与える可能性があることを示唆しています。
6. ユーザーの収入分布はどのようになっており、性別によってどのように異なりますか?

ユーザー間の全体的な収入分布:
分析されたユーザー数:1000
平均収入:50,988.45ドル
標準偏差:9,889.34ドル
最小収入:20,786.00ドル
25パーセンタイル:44,358.50ドル
中央値:50,841.50ドル
75パーセンタイル:57,396.00ドル
最大収入:81,931.00ドル
性別による収入分布:
女性ユーザー:
カウント:510
平均収入:51,329.89ドル
標準偏差:10,195.75ドル
最小収入:21,514.00ドル
25パーセンタイル:44,509.50ドル
中央値:51,259.00ドル
75パーセンタイル:58,137.75ドル
最大収入:81,931.00ドル
男性ユーザー:
カウント:490
平均収入:50,633.07ドル
標準偏差:9,557.44ドル
最小収入:20,786.00ドル
25パーセンタイル:44,204.00ドル
中央値:50,593.00ドル
75パーセンタイル:56,661.50ドル
最大収入:75,269.00ドル
重要な観察:
全体的な収入分布は、平均値の周りでの 中程度の広がり を示しており、標準偏差は9,889.34ドルです。
女性ユーザーの収入分布は、男性ユーザーと比較して わずかに高い平均収入 と 高い最大収入 を示しています。
男性ユーザーの収入分布は、女性ユーザーと比較して 中央値が低い と 最大収入が低い です。
女性ユーザーの 75パーセンタイル は、男性ユーザーのそれよりも著しく高く、女性ユーザーの 上位四分位 は 高収入 である傾向があります。
7. ユーザーの年齢分布はどのようになっており、性別によってどのように異なりますか?

ユーザーの年齢分布
全体の年齢範囲:18歳から49歳
平均年齢:33.5歳
標準偏差:9.38歳
最も一般的な年齢:20代前半から30代後半
性別による年齢分布
女性ユーザー:
カウント:510
平均年齢:34.55歳
標準偏差:9.18歳
年齢範囲:18歳から49歳
中央値:35歳
四分位範囲:27歳から43歳
男性ユーザー:
カウント:490
平均年齢:34.69歳
標準偏差:9.13歳
年齢範囲:18歳から49歳
中央値:35歳
四分位範囲:27歳から42歳
観察結果
年齢分布は両性別でかなり似ており、男性に わずかに高い平均年齢 があります。
両性別の 中央値は35歳 であり、中央値の周りの分布が均衡しています。
女性の 四分位範囲 は男性よりもわずかに広く、女性ユーザーの年齢にやや多様性があることを示しています。
8. ユーザーの魅力評価の分布はどのようになっており、他の変数(年齢や収入など)との相関関係はどうですか?
魅力と収入の相関:
'魅力'と'収入'の相関は 非常に低い であり、約 0.0055 の値を持っています。これは、これらの変数間に 有意な線形関係 がないことを示唆しています。
魅力評価の分布:
提供されたヒストグラムは、ユーザー間の魅力評価の分布を示しています。評価は、評価スケールの中間にわずかに傾く傾向を持ちながら、全体的に 比較的一様に分布している ようです(4、5、および6)。
魅力と年齢の相関:
'魅力'と'年齢'の相関は、約 -0.0508 であり、これは、年齢が増加するにつれて魅力評価がわずかに低下する傾向があることを示していますが、関係は 弱い です。
重要な観察結果:
魅力と収入や年齢の間に強い相関はありません。
ユーザー間の魅力評価は 均等に広がっており 、高評価や低評価に偏りはありません。
視覚データ は統計的発見を支持しており、散布図に明確なパターンや傾向はありません。
9. VIPメンバーシップを持つユーザーは、持たないユーザーに比べてより多くのマッチを受け取りますか?
VIPメンバーシップの影響:VIPメンバーシップを持つユーザーは、持たないユーザーに比べて著しく多くのマッチを受け取ります。
非VIPの平均マッチ数:59.14
VIPの平均マッチ数:94.81
統計的重要性:標準偏差は25.22で、この2つのグループ間にはかなりの違いがあることを示唆しています。
データの概要:分析はVIPユーザーと非VIPユーザーの二つの異なるグループに基づいています。
推奨事項:データは、VIPメンバーシップを購入することがマッチの数を増やしたいユーザーにとって有益である可能性があることを示しています。
10. VIPメンバーシップを最も購入しやすいユーザーの人口統計プロファイル(年齢、収入、子供)は何ですか?
VIPユーザーの年齢分布:
VIPユーザーの平均年齢は 34.51歳 です。
年齢範囲は 18歳から49歳 で、ユーザーの大多数は中30代であり、中央値は 35歳 です。
年齢分布は比較的標準的であり、標準偏差は 9.29歳 で、平均年齢の周りに適度な変動性があります。
VIPユーザーの収入分布:
VIPユーザーの平均収入は 50,781.21ドル です。
VIPユーザー間での収入は大きく異なり、標準偏差は 9,379.35ドル です。
VIPユーザーの収入範囲は 25005 から81,931 です。
中央値収入は 50,656.50ドル であり、VIPユーザーの半数がこの金額未満を稼ぎ、残りの半数がそれ以上を稼ぎます。
VIPユーザーの子供の分布:
VIPユーザーの平均子供数は 1.50 です。
標準偏差は 1.29 で、子供の数には広い分散があります。
子供の数は 0から3 までで、最も一般的なのは 0人の子供 (201ユーザー)、次に 1人の子供 (138ユーザー)、 2人の子供 (85ユーザー)、そして 3人の子供 (50ユーザー)です。