HOMEミクロデータの利用 ≫ 基本統計量に基づいた度数別数値パターン検索

基本統計量に基づいた度数別数値パターン検索

お知らせ

♢2020年8月18日(火) 日本オラクル株式会社ホームページで紹介されました。
一橋大学、小・中・高での統計教育の発展に貢献する「基本統計量に基づいた度数別数値パターン検索」にオラクルの自律型データベースを活用
https://www.oracle.com/jp/corporate/pressrelease/jp20200818.html

検索システム

https://trfrx9defnqboho-hito2uadw01.adb.ap-tokyo1.oraclecloudapps.com/ords/f?p=103

Username: hituacjp
Password: hituacjp

概要

統計教育や実証研究に役立つサンプルデータを作成するため、平均、分散、標準偏差、歪度及び尖度を用いた度数別の数値パターンデータベースを構築し、基本統計量に基づいた数値パターンを抽出するためのWebシステムです。このWebシステムの数値パターンは、整数値の組み合わせであるが、抽出後の数値パターンを最適化することにより、オリジナルデータに近似させることができます。

度数別数値パターンの検索

検索システム画面イメージ
  1. 範囲検索(Range Search)
    FREQ(度数):2から100までの正の整数を入力
    DEV%ile(標準偏差%ile):0から100までのパーセンタイルを含む任意の範囲(実数)を入力
    SKEW(歪度):歪度の値を含む任意の範囲を入力
    KURT(尖度):尖度の値を含む任意の範囲を入力
  2. 範囲検索(Range Search, 100 Results)
    1. 範囲検索(Range Search)の検索に時間が掛かる場合、100レコードのみ検索する。
  3. 近似値検索(Approximation Search, Dev%ile)
    検索したい標準偏差のパーセンタイルを入力することで、データベースに保存されている近似値(入力値の上下の二値)を抽出する。
  4. 近似値検索(Approximation Search, Skew)
    検索したい歪度を入力することで、データベースに保存されている近似値(入力値の上下の二値)を抽出する。
  5. 近似値検索(Approximation Search, Kurt)
    検索したい尖度を入力することで、データベースに保存されている近似値(入力値の上下の二値)を抽出する。

標準偏差パーセンタイルの計算

 

度数: (2~100の整数)

平均値: (正の数)

標準偏差: (0以上の数)

最大の標準偏差:  

標準偏差パーセンタイル:  

最適化

検索結果の数値パターンを利用して、オリジナルデータに近似した実数値にMS-EXCELのソルバーの機能を用いて最適化する。

〇最適化事例(MS-EXCEL ソルバー使用)
開示されている統計量からオリジナルのデータを求める。

度数 合計 分散 標準偏差 歪度 尖度
5 100 116.488 10.793 -0.913969483 1.8783073583892
(参考)
  X1 X2 X3 X4 X5 合計
オリジナル 34.1 24.5 21.9 18.4 1.1 100

統計量に基づき、Webシステムから数値パターンを抽出

  X1 X2 X3 X4 X5 合計
DB検索結果 34 25 21 19 1 100

MS-EXCELのソルバーの機能を利用して、オリジナルデータに近似した数値を推計

  X1 X2 X3 X4 X5 合計
最適化結果 34.0622 25.0083 20.9386 18.8991 1.09184 100

詳細は、下記EXCELファイルを参照してください。
最適化事例.xlsx

参考文献

Kiyomi Shirakawa, Yutaka Abe, Shinsuke Ito,
"Empirical Analysis of Sensitivity Rules: Cells with Frequency Exceeding 10 that Should Be Suppressed Based on Descriptive Statistics,"
In: Josep Domingo-Ferrer and Mirjana Pejić-Bach eds., Privacy in Statistical Databases: UNESCO Chair in Data Privacy, International Conference, PSD 2016, Dubrovnik, Croatia, September 14 - 16, 2016, Proceedings, Springer, 2016, pp.28-40