Rは非常に便利なソフトウェアです。でも、あまりにも便利なため「基本」の統計量を算出する方法を蔑ろにしがちです。勉強、何かのきっかけになればと思います。なお、分散は「いつか」紹介します。
算術平均、中央値、幾何平均、調和平均を算出するコマンドの紹介です。データの傾向を知るためにはどれも重要な指標です。
はて、地球の中心値。球体ではなく「地球を平面で見たときの中心値(地?)」はどこでしょうか。地図では発行国が中心になる傾向が多いようですが。秋の夜長に思慮してみるのもオツかも知れません。
実行コマンドはR version 4.2.2で確認しています。
実行コマンド
詳細はコメントを確認してください。
###データ例の作成#### set.seed(1234) TestData <- rnorm(100, mean = 2, sd = 10) GeoMData <- c(500, 1500, 20000, 1500, 500) ######## #ヒストグラムの描写 hist(TestData) #算術平均 mean(TestData, na.rm = TRUE) [1] 2.110568 #下記と同じ #残念ながら欠損値は考慮していません sum(TestData)/length(TestData) [1] 2.110568 #中央値 median(TestData, na.rm = TRUE) [1] 1.830129 #幾何平均 #0や負を含まない #ベクトルの積積:cumprodコマンド max(cumprod(GeoMData))^(1/length(GeoMData)) [1] 1622.671 #下記と同じ exp(mean(log(abs(GeoMData)))) [1] 1622.671 #調和平均 length(TestData)/sum(1/TestData) [1] 7.232387 #下記も同じ 1/mean(1/TestData) [1] 7.232387
少しでも、あなたの解析が楽になりますように!!