دليل الصحفي لتعلم صحافة البيانات متاحاً الآن باللغة العربية!
IJNET: تحت عنوان “صحافة البيانات كيف نستخرج الأرقام والمعلومات في الإنترنت” أصدرت شبكة الجزيرة الإعلامية مؤخراً دليلاً تدريبياً أعده المحررون جوناثان جراي وليليان بونيجرو ولوسي تشيمبرز وترجمه محمد شقير، وهو متوفر باللغات العربية والإنجليزية.
شبكة الصحفيين الدوليين تقدم عرضاً مختصراً لأهم ما جاء في الدليل التدريبي ويمكن تحميله عبر الموقع الإلكتروني.
وجاء في كلمة محررو الكتاب في المقدمة : “ولد كتاب “صحافة البيانات” في ورشة بلندن عام 2011 . ومنذ ذلك الحين انتشر هذا اللون من الاستقصاء الصحافي، وسرعان ما اتسع نطاقه ليصبح جهداً دولياً جماعياً، وفي غضون ستة أشهر منذ البدء في وضع الكتاب وحتى صدور أول طبعة منه، ساهم المئات في تشكيله.
يحتوي الكتاب على مئات الأمثلة لأخبار تصدرت الصحف والمواقع الإلكترونية، تم استخراجها من أكوام المعلومات والأرقام المتاحة في الإنترنت والدفينة في السجلات الرسمية.
يتألف الكتاب من ستة فصول أساسية، نعرضها عليكم بشكل مختصر:
1- الفصل الأول
يتناول تعريف لمصطلح صحافة البيانات، وجاء فيه :” البعض ينظر إلى “البيانات” باعتبارها مجموعة من الأرقام غالباً ما تكون مجمعة في جداول بيانية؛ وقبل 20 عاماً، كان هذا هو النوع الوحيد تقريباً من البيانات التي يتعامل معها الصحافيون. لكننا اليوم نعيش في عالم رقمي، يمكن وصف أي شيء وكل شيء فيه تقريباً بالأرقام، وهو ما يحدث بالفعل”.
ومن أمثلة استخدام البرمجة لتحويل عملية جمع المعلومات ومزجها من مصادر كالحكومة المحلية والشرطة والمصادر المدنية الأخرى إلى عملية دمج تلقائية، ما فعله “آدريان هولوفاتي” في قسم الجرائم من صحيفة شيكاغو.
ويمكن استخدام برنامج كمبيوتر لإيجاد روابط بين مئات الآلاف من الوثائق، كما فعلت صحيفة التليغراف في موضوع نفقات النواب.
يمكن لصحافة البيانات أن تساعد الصحافي على سرد خبر معقد عبر طرح يتضمن إدخال الرسوم البيانية، مثلما فعل “هانز روزلينج ” في مناقشاته حول توضيح الفقر العالمي مرئياً الذي أثار ملايين الآراء عالمياً.
لا تحتاج إلى بيانات جديدة لتحصل على سبق صحفي، أحياناً تكون البيانات عامة ومتاحة بالفعل، ولكن لم ينظر فيها أحد عن قرب. في حالة تقرير وكالة أسوشيتد برس المنشور في 4,500 صفحة من الوثائق، التي رفعت عنها السرية والتي تصف ممارسات الشركات الأمنية الخاصة أثناء حرب العراق، حصل على المادة صحفي مستقل بتقديم طلبات إلى وزارة الخارجية الأمريكية بالحصول على المعلومات بموجب قانون “حرية المعلومات”.
باستخدام أساليب ومناهج تحليلات النص، تم تطوير طريقة تظهر مجموعات من الكلمات البحثية الموجودة في آلاف من تقارير الحكومة الأمريكية حول حرب العراق والتي سربها موقع ويكيليكس في صورة مرئية.
الصحافة بمساعدة الكومبيوتر
هناك تاريخ طويل وراء استخدام البيانات لإعداد التقارير وتقديم معلومات منظمة، وربما تكون “الصحافة بمساعدة الكمبيوتر” أو ” CAR “هي الأقرب لما نطلق عليه الآن اسم صحافة البيانات. فقد كانت أول أسلوب منظم ومنهجي لاستخدام الكمبيوتر في جمع وتحليل البيانات من أجل تحسين الأخبار.
يدور حالياً نقاش الاستمرارية والتغيير حول مسمى “صحافة البيانات” وعلاقته بتلك الممارسات الصحفية السابقة التي تستخدم تقنيات حاسوبية لتحليل مجموعات من البيانات.
يقول البعض إن هناك فرْقا بينهما وأن CAR أسلوب لجمع البيانات وتحليلها كوسيلة لتعزيز الصحافة؛ عادةً ما تكون الصحافة الاستقصائية، بينما تهتم صحافة البيانات بطريقة وضع البيانات في السياق الكامل للعمل الصحفي.
من هذا المنطلق، تهتم صحافة البيانات بشكل أكبر بالبيانات نفسها بدلاً من استخدام البيانات كمجرد وسيلة لإيجاد الأخبار أو تعزيزها. لذا نجد أن مدونة بيانات الغارديان أو صحيفة تكساس تريبيون تنشران مجموعات البيانات إلى جانب الأخبار، أو حتى تنشران مجموعات البيانات وحدها ليحللها الناس ويستكشفونها.
هناك فرق آخر وهو أن الصحافيين الاستقصائيين كانوا في الماضي يعانون من فقر في المعلومات المتعلقة بسؤال يحاولون الإجابة عنه أو بقضية يحاولون تناولها. وبينما لا يزال الحال كذلك بالطبع، هناك وفرة هائلة في المعلومات لا يعلم الصحافيون بالضرورة ماذا يفعلون بها. فهُم لا يعرفون كيفية الحصول على قيمة للبيانات التي بين أيديهم. ومثال أخير على ذلك هو قاعدة بيانات نظام المعلومات الموحدة على الإنترنت، أكبر قاعدة بيانات لمعلومات الإنفاق في المملكة المتحدة.
2- الفصل الثاني
يتناول الفصل الثاني “غرفة الأخبار” وأليات العمل ويبدأ بالسؤال هل ينبغي على الصحافيين تعلم كتابة الكود أو العمل جنباً إلى جنب مع المطوّرين الموهوبين؟
ينبغي على المؤسسات الإعلامية الكبرى أن تشارك في بناء القدرات للتغلب على تحديات صحافة البيانات. هناك الكثير من خبراء الكمبيوتر والمبرمجين المختبئين في الأقسام التقنية لمؤسسات الإعلام ويتوقون للخروج منها.
التنقيب في البيانات
من المثمر الاشتراك مع فرق استقصائية أو برامج لديها الخبرة والوقت اللازمين لتقصّي الخبر. وقد قام برنامج “بانوراما” المعني بأحداث الساعة في بي. بي. سي بقضاء عدة أشهر في العمل مع مركز الصحافة الاستقصائية لتجميع البيانات حول رواتب القطاع العام. وكانت النتيجة فيلماً وثائقياً تلفزيونياً وتقريراً خاصاً على الإنترنت اسمه “رواتب القطاع العام“.
ومن المهم تشجيع القارئ على استكشاف التقرير أو متابعة القصة وألا يشعر أبداً بالارتباك بسبب الأرقام.
من أهم برامج التحقق من البيانات:
-
برنامج إكسل Excel
-
ومحرر مستندات جوجل Google Docs
-
جداول فيوجن Fusion Tables
-
برنامج MySQL
-
قواعد بيانات Access و Solr
-
استخدام برامج RDF و SPARQL للبدء في البحث
-
استخدام خرائط جوجل وبينغ وجوجل إيرث إلى جانب خرائط ArcMAP لاستكشاف البيانات الجغرافية وتوضيحها مرئياً.
-
للرسوم البيانية نستخدم باقة برامج Adobe Suite
كيف توظف مبرمج كمبيوتر
يقول آرون بيلهوفر من صحيفة نيويورك تايمز: قد تجد أن المؤسسة التي تعمل بها لديها بالفعل أشخاص يملكون المهارات المطلوبة، ولكنهم ليسوا بالضرورة موجودين معك في غرفة الأخبار. تجوّل قليلاً، قم بزيارة أقسام التكنولوجيا والمعلومات ومن الأرجح أن تجد غايتك. ومن المهم أيضاً أن تقدّر ثقافة كاتبي المدونات.
تحتاج إلى شخص تتوفر فيه عدة مهارات وليس مهارة واحدة، إلى جانب المهارة الفنية؛ إمكانية العمل تحت الضغط؛ لأن تطبيقات الأخبار تتطلب معالجة البيانات وتصميم الرسوم البيانية الديناميكية.
ومن مواصفات المبرمج الجيد أنه يمكنه السرد بشكل جيد. ويجب على كل مشارك أن يحترم زملاءه وأن يكون مستعداً للتفاوض ويمتلك إمكانية أن يعلّم نفسه بنفسه لأن التكنولوجيا تتطور بشكل متلاحق.
معرفة تقنية بسيطة
تعتبر صحافة البيانات مجالاً تقنياً إلى حد كبير. ففي بعض الأحيانً عليك أن تستخرج البيانات، وفي أحيان أخرى عليك أن تقوم ببعض البرمجة لتوضيح بياناتك بصورة مرئية. ومن أجل إنجاز صحافة بيانات متميزة، ستحتاج إلى أمرين: الرؤية الصحفية لصحفي متمرس والمعرفة التقنية لخبير رقمي.
الاستفادة من شبكات الصحافة الاستقصائية القائمة، منها:
-
مشروع إعداد التقارير حول الفساد والجريمة المنظمة
مشاريع البيانات لا تتقادم بمرور الوقت ويمكن إضافة مواد جديدة إلى تطبيقات صحافة البيانات، اعتماداً على تصميمها. وهي ليست للمستخدمين فقط، بل يمكن استخدامها داخلياً من أجل إعداد التقارير والتحليلات. وإذا كنت تخشى من أن يؤدي هذا الأمر إلى استفادة منافسيك من استثمارك، يمكنك إبقاء بعض الخصائص أو بعض البيانات للاستخدام الداخلي فقط.
3- الفصل الثالث
يتناول هذا الفصل دراسة لحالات نموذجية؛ منهاتحقيق لمدة تسعة أشهر حول الصناديق الهيكلية الأوروبية خلال عام 20100 حيث تعاونت صحيفة فاينانشيال تايمز مع مكتب الصحافة الاستقصائية للتحقيق في الصناديق الهيكلية الأوروبية. كان الهدف من التحقيق معرفة المستفيدين من الصناديق الهيكلية الأوروبية والتأكد من عدم إهدار تلك الأموال.
مثال آخر عن تغطية مدونة البيانات بصحيفة الغارديان لأحداث الشغب في المملكة المتحدة في صيف عام 2011 عندما تعرضت بريطانيا لموجة من أحداث الشغب، تعاونت صحيفة الغارديان مع كلية لندن للاقتصاد وقاما معاً بإنشاء هذا المشروع الرائد “قراءة أحداث الشغب“.
استخدمت الصحيفة صحافة البيانات بشكل مكثف لتمكين الناس من فهم من يقوم بالسلب والنهب، وما السبب في ذلك. كما أنهم عملوا مع فريق آخر من الأكاديميين، بقيادة الأستاذ روب بروكتر من جامعة مانشستر، لفهم دور الإعلام الاجتماعي بشكل أفضل، والذي استخدمته صحيفة الغارديان نفسها بشكل مكثف في إعداد تقاريرها أثناء أحداث الشغب.
صحافيو البيانات المواطنون
ليست غرف الأخبار وحدها التي تستطيع العمل على أخبار مبنية على البيانات، فنفس تلك المهارات التي تفيد صحافيي البيانات يمكنها أيضاً أن تساعد الصحافيين-المواطنين في الحصول على البيانات الخاصة بمنطقتهم وتحويلها إلى أخبار.
كان هذا الدافع الأساسي لمشروع إعلام المواطنين “أصدقاء جانواريا” في البرازيل.
4- الفصل الرابع
يشمل نصائح للبحث عن البيانات على محركات البحث وعرض الطرق الأخرى للحصول عليها ومنها:
● عند البحث عن البيانات، تأكد من وضع كل من مصطلحات البحث المتعلقة بمحتوى البيانات التي تبحث عنها وبعض المعلومات عن النمط أو الصيغة أو المصدر الذي تتوقع ورود البيانات به.
-
يتيح جوجل وبعض محركات البحث الأخرى البحث حسب نوع الملف. فمثلاً، يمكنك البحث عن الجداول البيانية فقط بإضافة نوع الملف إلى بحثك: XLS أو نوع الملف: CSV، أو البيانات الجغرافية (نوع الملف: shp) (أو مقتطفات من قواعد البيانات) نوع الملف: MDB أو SQL أو DB ويمكنك البحث عن (ملفات PDF إذا اضطررت لذلك) نوع الملف: pdf.
● يمكنك أيضاً البحث بجزء من عنوان URL. بالبحث في جوجل عن (inurl:downloads filetype:xls) سيحاول محرك البحث أن يعثر على كل ملفات إكسل التي توجد بها كلمة downloads في عنوان الويب الخاص بها، إذا وجدت نتيجة واحدة، فإن الأمر عادةً ما يتطلب منك أن تنظر في النتائج الأخرى لنفس المجلد على كمبيوتر خادم الويب (Web Server). يمكنك أيضًا أن تحدد نتائج بحثك لتتضمن فقط اسم مجال واحد بالبحث مثلاً عن ‘site:agency.gov‘.
التوجه مباشرة إلى المصدر
محاولة التوجه مباشرة إلى صاحب البيانات، وليس إلى مسؤول الشؤون العامة! يمكنني بالطبع صياغة طلب على أساس قانون حرية المعلومات أو طلب للسجلات العامة، ولكن هذا سيبطئ العملية.
تصفح مواقع البيانات وخدماتها
على مدى السنوات القليلة الماضية، ظهرت بوابات بيانات متخصصة ومراكز بيانات ومواقع بيانات أخرى على الويب، وهي أماكن جيدة للاطلاع على أنواع البيانات الموجودة. وفي البداية يمكن تصفح ما يلي:
1- بوابات البيانات الرسمية
2- موقع مؤسسة المعرفة المفتوحة
3- موقع “بيانات حكومات العالم” الذي أطلقته صحيفة الغارديان
4- مدونة Scraperwiki
5- بوابة البيانات لدى البنك الدولي
6- بوابة البيانات لدى الأمم المتحدة
7- Infoshimps
8- Data Market
أول وأكبر عمل عليك أن تتولاه عند الحصول على قاعدة بيانات جديدة هو أن تفحص مدى فوضويتها، ومن ثم القيام بتنظيمها. هناك طريقة جيدة وسريعة لفحص الفوضوية وهي أن تضع جداول التوزيع التكراري لمتغيرات الفئات التي يتوقع أن يكون بها عدد صغير نسبياً من القيم المختلفة.
عندما تستخدم برنامج إكسل مثلاً، يمكنك فعل ذلك باستخدام جداول Filter أو Pivot لكل من المتغيرات الفئوية، تستطيع أدوات مثل Google Refine أن تجعل عملية التنظيم ووضع المعيار أسرع.
6- الفصل السادس “تقديم البيانات”
توجد طرق عديدة لتقديم البيانات التي لديك للجمهور، منها نشر مجموعات بيانات أولية مع الأخبار، وإضافة توضيحات مرئية جميلة، وإنشاء تطبيقات إنترنت تفاعلية. ومن ضمن المواقع التي يمكنها أن تساعدك على تصميم أنفوجرافيك:
تختلف القصة باختلاف الرسوم البيانية
هناك العديد من الأدوات التي يحتاج الصحفي الجيد إلى فهمها ووضعها ضمن أدواته لبناء التوضيحات المرئية. وبدلاً من البدء بالجزء الصعب، من المهم الحصول على تمهيد ومعرفة أساسية توفرها الرسوم البيانية. فكل ما تقوم به يجب أن ينبع من سلسلة رسوم بيانية مبسّطة. إذا تمكنت من إجادة الأساسيات، يمكنك أن تنتقل إلى بناء توضيحات مرئية أكثر تعقيداً مكونة من تلك الوحدات الأساسية.
هناك نوعان من أكثر أنواع الرسوم البيانية أساسية وهما الرسم البياني العمودي والرسم البياني الخطي. وعلى الرغم من أنهما متشابهان جداً من حيث حالات استخدامهما، إلا أنهما قد يختلفان كثيراً في معانيهما.
من أشهر المواقع المساعدة هما تابلو و Google chart tools للرسوم البيانية.
ننصحكم بالاطلاع على دليل “صحافة البيانات كيف نستخرج الأرقام والمعلومات في الإنترنت” باللغة العربية، هنا أو الإنجليزية، هنا بالإضافة إلى توفره بلغات مختلفة.