إم حاليا باستخدام عينة 10 من مجموعة بيانات كبيرة جدا (10 فارس، أكثر من 300m الصفوف) التي تصل إلى أكثر من 200 غيغابايت من البيانات عند تخزينها في تنسيق. dta لمجموعة كاملة من البيانات. ستاتا قادرة على التعامل مع عمليات مثل إغن، والانهيار، والاندماج، وغيرها في كمية معقولة من الوقت لعينة 10 عند استخدام ستاتا-مب على ملقم أونيكس مع 50G من ذاكرة الوصول العشوائي ومختلف النوى. ومع ذلك، الآن أريد أن انتقل إلى تحليل العينة بأكملها. حتى لو كنت تستخدم جهاز يحتوي على ذاكرة الوصول العشوائي كافية لعقد مجموعة البيانات، ببساطة توليد متغير يأخذ الأعمار. (أعتقد أن عمليات الخلفية قد تتسبب في تشغيل ستاتا في الذاكرة الظاهرية) المشكلة هي أيضا قابلة جدا للتوازي، أي الصفوف في مجموعة البيانات مستقلة عن بعضها البعض، حتى أتمكن من التفكير بسهولة كما في مجموعة كبيرة واحدة كما 100 مجموعة بيانات أصغر. هل لدى أي شخص أي اقتراحات لكيفية معالجة هذه البيانات أو يمكن أن تعطيني ردود الفعل على بعض الاقتراحات لدي حاليا أنا في الغالب استخدام ستاتاساسماتلاب لذلك ربما هناك نهج أخرى أنا ببساطة لا يدركون. وهنا بعض من أفكاري الحالية: تقسيم مجموعة البيانات حتى في مجموعات البيانات الصغيرة والاستفادة من المعالجة الموازية غير الرسمية في ستاتا. يمكنني تشغيل بلدي كليانينغبروسينغسينغاناليسيس على كل قسم ثم دمج النتائج بعد دون الحاجة إلى تخزين جميع أجزاء وسيطة. استخدام سكل لتخزين البيانات وأيضا تنفيذ بعض التلاعب البيانات مثل التجميع على قيم معينة. أحد المخاوف هنا هو أن بعض المهام التي ستاتا يمكن التعامل بسهولة إلى حد ما مثل مقارنة القيم عبر الزمن لن تعمل بشكل جيد جدا في سكل. أيضا، إم بالفعل تعمل في قضايا الأداء عند تشغيل بعض الاستعلامات في سكل على عينة 30 من البيانات. ولكن ربما إم لا الأمثل من خلال الفهرسة بشكل صحيح، وما إلى ذلك أيضا، يبدو شارد الاستعلام مثل أنه يمكن أن تساعد مع هذا ولكن أنا لم بحثت ذلك أيضا بدقة حتى الآن. R أيضا تبدو واعدة، ولكن أنا لست متأكدا إذا كان من شأنه أن يحل مشكلة العمل مع هذا الكم الهائل من البيانات. منذ كنت على دراية ستاتا هناك أسئلة وأجوبة موثقة جيدا حول مجموعات البيانات الكبيرة في ستاتا التعامل مع مجموعات البيانات الكبيرة. قد تجد هذا مفيدا. وأود أن تنظيف عبر الأعمدة، وتقسيم تلك، وتشغيل أي إجراءات التنظيف محددة ودمج مرة أخرى في وقت لاحق. اعتمادا على موارد الجهاز الخاص بك، يجب أن تكون قادرا على الاحتفاظ الأعمدة الفردية في عدة ملفات مؤقتة باستخدام تمبفيل. الحذر لتحديد المتغيرات أو الأعمدة الأكثر صلة بالتحليل الخاص بك يجب أن تقلل من حجم مجموعة الخاص بك الكثير جدا. أجاب على نوف 22 13 في 7:10 mustn39t الرابط الذي ذكرته يشير إلى هذه الصفحة. نداش راديك نوف 22 13 في 11:25 على الاطلاق الحق، غبي لي، نسخ المعكرونة فوضى هناك نداش D3L 23 نوفمبر في 12:29 شكرا D3L. المشكلة هنا هي أنني تشغيل بعض التعليمات البرمجية التلاعب البيانات التي تتطلب التفاعل بين الأعمدة. تقسيم الصفوف هو واحد حل ممكن ولكن من مرهقة جدا للمهمة أنا أؤدي. نداش user3018549 نوفمبر 26 13 في 15: 40Stata: تحليل البيانات والبرامج الإحصائية 1. قراءة وإدخال البيانات كيف يمكنني الاتصال بقاعدة بيانات باستخدام البرنامج المساعد ستاتا كيف يمكنني تصدير الجداول من ستاتا لماذا أحصل على صفوف من البيانات المفقودة عندما استخدام إنفيل كيف يمكنني تحويل ملفات حزم أخرى إلى ملفات بيانات تنسيق ستاتا كيفية إعداد اسم مصدر بيانات أودبك ل ستاتا في ويندوز كيفية إعداد اسم مصدر بيانات أودبك ل ستاتا على ماك أو لينوكسونيكس ستاتا يقرأ في المتغيرات الخاصة بي كسلسلة بدلا من رقمية. ماذا يجب أن أفعل كيف يمكنني تحويل متغيرات التاريخ إلى تواريخ ستاتا المنقضية عند تشغيل الأرقام معا مثل ldquo4151999rdquo كيف يمكنني الحصول على معلومات من إكسيل إلى ستاتا كيف يمكنني استخدام إنفيل لقراءة في بيانات ثابتة الشكل يمكن أن يكون إنفيل قراءة في مجموعة بيانات هرمية 2. الجمع بين مجموعات البيانات كيفية معالجة مجموعات البيانات الكبيرة جدا في ستاتا 3. استخدام الذاكرة كم ستكون مجموعة البيانات الخاصة بي 4. معالجة البيانات 4.1 إنشاء متغير كيف يمكنني أخذ عينات من المجموعات. ليس الأفراد كيف يمكنني تحديد الأول والأخير يحدث بانتظام في لوحة البيانات. كيف يمكنني التعامل مع تقرير قيم الوقت المتكررة داخل لوحة. كيف يمكنني إنشاء متغيرات تحتوي على ملخصات في المئة كيف يمكنني إنشاء متغير يحتوي على آخر عدة تواريخ كيف أقسم متغير سلسلة إلى أجزاء ما هو صحيح وكاذب في ستاتا كيف أحسب مقاييس مثل النسبة المئوية تحسنت ناقص في المئة تدهور كيف إنشاء متغيرات تلخيص لكل خصائص فردية لأعضاء المجموعة الآخرين كيف يمكنني إنشاء معرفات فردية مرقمة من 1 صعودا كيف يمكنني إنشاء متغير تسجيل ما إذا كان أي أعضاء من مجموعة (أو جميع أعضاء مجموعة) تمتلك بعض السمات كيف يمكنني إنشاء متغيرات وهمية 4.2 تخفيضات قصيرة كيف يمكنني إجراء عمليات عنصر لكل عنصر على المصفوفات كيف يمكنني قائمة. قطرة . والحفاظ على مجموعة متتالية من المتغيرات دون كتابة الأسماء بشكل فردي هل يمكنني تطبيق أمر قيم التسمية على أكثر من متغير واحد في نفس الوقت أريد إرفاق تصنيفات القيمة نفسها لعدة متغيرات. 4.3 النتائج المحيرة كم عدد الأرقام الهامة موجودة في تعويم لماذا تعطي الدالة (x، y) في بعض الأحيان نتائج محيرة لماذا لا تعادل وزارة الدفاع (0.3، 0.1) 0 لماذا كانرسكوت قارنت قيمتين أعرفها متساوية لماذا هو xgt1000 صحيح عندما يحتوي x على قيم مفقودة لماذا بلدي ملف أو ملف أدو تنتج نتائج مختلفة في كل مرة تشغيله 4.4 التلاعب مجموعة البيانات كيف يمكنني تحويل بلدي إيسد-9 رموز من نوع سلسلة إلى نوع رقمي كيف يمكنني التحقق متغير لمجموعة من التشخيص أو رموز الإجراءات كيف يمكنني تسمية التشخيص أو رموز الإجراءات مع أوصافها كيف يمكنني حساب الحد الأقصى أو الأدنى ينظر حتى الآن في تسلسل ما هي التعبيرات العادية وكيف يمكنني استخدامها في ستاتا كيف إزالة الأصفار الرائدة أو المتتالية من متغيرات السلسلة كيف أذهب عبر مجموعات متغير بترتيب أول ظهور لها في مجموعة البيانات كيف يمكنني إسقاط نوبات القيم المفقودة في بداية ونهاية بيانات اللوحة هل هناك طريقة لإخبارها ستاتا لمحاولة كل شيء قيم متغير معين في بيان فوريش دون تحديدها أريد حساب متغير يحتوي على إحصاءات ملخص المجموعة المرجح. ولكن أنا لا أريد لانهيار البيانات و إغن لا يدعم الأوزان. كيف يمكنني أن أفعل هذا كيف أتعامل مع استجابات متعددة كيف يمكنني تصغير مجموعة البيانات والاحتفاظ بالتصنيفات المتغيرة نفسها كيف يمكنني تحديد عمليات المراقبة المتتابعة في بيانات اللوحة كيف يمكنني تحديد مجموعة فرعية من الملاحظات باستخدام معيار معقد كيف يمكنني حفظ واحد أو أكثر من أجزاء مجموعة بيانات كبيرة كيف يمكنك تعريف خصائص المجموعة بكفاءة في البيانات الخاصة بك لإنشاء مجموعات فرعية كيف أقوم بإجراء عمليات متعددة على سجلات البيانات إذا تم استيفاء شرط أواجه مشاكل مع الأمر إعادة تشكيل. هل يمكن أن تعطي المزيد من التوجيه كيف يمكنني إنتاج مجموعة بيانات استنادا إلى جميع أزواج ممكنة من المعرفات داخل كل مجموعة لماذا لا يتضمن الأمر ديسترينغ في ستاتا خيار ترميز كيف يمكنني إنشاء مجموعة بيانات (مصفوفة) من الوسائل (إحصائيات أخرى) للمتغيرات من مجموعة البيانات الحالية كيف يمكنني تنفيذ أرايس مثل ساس في ستاتا 4.5 استبدال القيم أو الملاحظات كيف يمكنني استبدال القيم المفقودة مع القيم السابقة أو التالية غير مضمن أو ضمن تسلسل كيف يمكنني استبدال ملاحظة متغير مع ملاحظة مختلفة لمتغير آخر 5 الإبلاغ عن البيانات كيف أحسب عدد القيم المميزة التي تم رؤيتها حتى الآن كيف أحسب عدد السلاسل المميزة عبر مجموعة من المتغيرات كيف أحسب عدد الملاحظات المتميزة كيف أقوم بتبويب الترددات التراكمية كيف أسرد الملاحظات في مجموعة تختلف على متغير هل هناك طريقة لوضع الأصفار الرائدة في الإخراج كيف يمكنني إنتاج جدول متغير سلسلة مسرد في منطقي بدلا من الترتيب الأبجدي هل هناك أي طريقة مباشرة لحفظ متغير جديد الترددات التي تم الحصول عليها من خلال تطبيق جدولة الأوامر كيف يمكنني تحديد الجيران من النقاط أو المناطق على شبكة مستطيلة في ستاتا كيف يمكنني تحديد سنوات كبيسة في ستاتا لماذا أنا الحصول على رسالة خطأ أن هناك مساحة كافية على القرص كيف يمكنني وضع التاريخ والوقت الحالي في ملفات السجل الخاص بي كيف يمكنني تجميع نتائج الأوامر الفورية لماذا يشكو الأمر أنه لا توجد ملاحظات 7. أسئلة وأجوبة بشأن الإفراج قبل ستاتا 14 لماذا أحصل على الخطأ لدكورونغ عدد من فالويسوركو عند استخدام إنشيت لقراءة البيانات من إكسيل يمكنني استخدام أودبك للكتابة إلى ملف إكسل موجود كل صباح لدي لتعيين حجم الذاكرة بلدي، على سبيل المثال، 20M. الافتراضي، 1M، غير كافية لبياناتي. هل هناك طريقة لتغيير الإعداد الافتراضي لماذا أحصل على رسالة الخطأ لدكو لا مجال لإضافة المزيد من الملاحظات رديقو كيف يمكنني استخدام مجموعة بيانات أكبر من ذاكرة الوصول العشوائي المتوفرة كيف يمكنني تطبيق القيمة الأصلية والتصنيفات المتغيرة بعد استخدام ريشيب كوماند لماذا تقوم عملية الدمج بإنتاج مجموعة بيانات تحتوي على عدد كبير جدا من الملاحظات هل هناك طريقة لإخبار ستاتا بمحاولة تجربة كل قيم متغير معين في بيان بدون تحديدها كيف يمكنني تحديد الملاحظات المكررة في بياناتي كيف يمكنني تحويل حزم أخرى الملفات إلى ملفات بيانات تنسيق ستاتا ماذا أفعل إذا كان الأمر الذي أحتاج إليه لا يمكن استخدامه مع بواسطة كيف يمكنني إنشاء متغير يحتوي على تسلسل متكرر للأرقام ما هو الأمر إعادة تشكيل جديد لماذا إعادة تشكيل تعطي أيضا الكثير من المتغيرات خطأ لماذا أنا أتلقى رسالة أنه لا يوجد مجال على القرص الصلب
No comments:
Post a Comment