データセットの編成

データセットの複数のバージョンやデータセットの変更がある場合は、よく考えられたデータ編成システムを選択することで、データを追跡するのに役立ちます。 これは、特に大規模なチームで保持しています。 データ組織を開始するには、研究データの構造を定義する必要があります。 最も重要な構造タイプを以下に示します:

データを整理するための可能な方法
データを整理するための可能な方法。 A:非階層データの長方形の組織。 B: “ワイド”形式の二つの階層レベル(被写体と測定機会)を持つデータ。 C:「長い」形式の2つの階層レベルを持つデータ。 D:階層構造化データファイルのパターン。 E:リレーショナルデータベース構造。
  • 平らな長方形のファイルまたは表形式のデータは、すべての統計および表計算プログラムで読み取ることができる古典的でよく使用されるデータ構造
    • 長方形のファイルを構造化する一般的な方法は、ワイド形式です(上の画像の表A): 列は異なる変数を表し、線は異なる観測値(被験者など)を表します。 しかし、ワイドフォーマットの問題は、データが階層的に構造化されている場合、例えば、測定を繰り返した設計で発生します(上の図の表Bを参照)。 測定の機会の数が観測値間で異なる場合、多くのセルは設計上空のままになります。
    • 一つの解決策は、データセットのための長い形式を使用することができます(上の画像の表Cを参照してください)。 長い形式では、すべての行は一つの観測単位を示しています(例えば 特定の人のための1つの測定の機会)および変数は測定の機会を特徴付けます(例えば日1、前テスト等。). この形式は、古典的な長方形のファイル内の階層データの表現を可能にします。 長い形式のファイルには、高次の観測単位の特徴がすべての行で繰り返されるため、いくつかの冗長性が含まれます(例:被験者の性別や生年などの時 統計パッケージ内の関数は通常、これらの形式のいずれかでのみ動作するため、ワイド形式とロング形式の間の変換は頻繁なタスクであり、対応する関
  • 階層ファイルは、長方形のファイルを使用するときに発生する冗長性を回避するために使用できます(上の図の表Eを参照)。 XMLファイルはこの要件を満たし、データとメタデータを1つのファイルに保存できます。 しかし、これらの利点にもかかわらず、XMLファイルは心理学では一般的に使用されておらず、統計ソフトウェアはしばしば入力として表形式のデータを必
  • リレーショナルデータベースは、異なる階層レベルのデータを別々の長方形のテーブルに整理し、異なるテーブルは定義された関連付けを介して接続されます。 個々のテーブルは、統計的に分析したり、新しいテーブルを形成するためにリンクすることができます。 リレーショナルデータベースは複雑な関連付けをエレガントな方法で表現できますが、データベース言語(SQLなど)の管理と知識が必要です。

研究データの編成

心理研究データを明示的に参照するベストプラクティスも命名規則もないため、プロジェクト層で開発されたガイダンスをお勧めします。

さらに、ボストン大学図書館(n.d.)の命名規則の設計に関する一般的なガイダンスが役立つかもしれません:

  • 選択したファイル名は、ファイル全体で一貫して使用する必要があります(常に同じ情報を同じ順序で含める必要があります)

将来の観点から、ファイルをどのように整理するかを検討してください。project_instrument_location_date_time_version。

  • 変更を元に戻すことができるように、ファイル名には常に日付を含める必要があります。YYYY-MM-DD形式を使用します。
  • ファイル名に次の記号を使用しないでください。”/\:*? ” < > & $. 彼らは、いくつかのコンピュータのオペレーティングシステムで特定の意味を持っているので、ファイルの誤読、あるいは削除になる可能性があります。
  • スペースを使用して用語を区切るのではなく、アンダースコア(_)を使用します。
  • フォルダに何が含まれているかが明確になるように、説明的な方法でフォルダに名前を付け、名前を短くしてください(最大15-20文字。)
  • また、ファイル名を短く説明的に保つようにしてください(<25文字)
  • 自動バージョニングソフトウェアを使用しない場合は、ファイル名の最後にバージョ. ファイルが保存されるたびに変更します(また、バージョン管理に関するナレッジベースのセクションを参照してください)。 これは、変更を追跡できるように、ファイルで一緒に作業している複数の人がいる場合に特に重要です。
  • 最終バージョンでは、バージョン番号の代わりにFINALという単語を使用します。 これは、ファイルを共有する場合に特に便利で重要です!
  • ファイル名には、ファイル拡張子の前にピリオドを1つだけ含める必要があります。project_name_dateなど。ドクないproject.name.date.doc またはproject_name_date。.すでに多くのファイルに名前を付けている場合は、Bulk Rename Utility(Windows)、ReNamer(Mac OS X)、PSRenamer(Mac OS X、Windows、Unix、Linux)、Zamzar(ファイルをオンラインで変換)などのファイル名変更アプリケー

DataWiz webアプリケーションは、研究プロジェクトのための事前定義された構造とドキュメントスキームを提供することにより、研究データを整理するのに役立

その他のリソース

  • SQLは、リレーショナルデータベース管理システムのデータ管理に特化したプログラミング言語です。
  • XMLは相互運用可能な人間および機械可読マークアップ言語であり、そのシンプルさと一般的な使いやすさのために研究データ管理で広く使用されています。

コメントを残す

メールアドレスが公開されることはありません。

lg