صحافة البيانات: من علم الحساب إلى التصميم (منهج دراسي – الجزء ٥)

من النادر أن يحصل الصحفيون على بيانات يمكن استخدامها مباشرة من مصادرها الأولى، إذ يتعين على أبرع خبراء البيانات قضاء وقت طويل في تنظيف البيانات وتحويلها إلى صورة صالحة للاستخدام.

تنظيف البيانات عملية بطيئة تتطلب صبرًا ونظامًا دقيقًا ومجموعة متسلسلة من العمليات من شأنها التأكيد على سلامة البيانات خلال كل مرحلة من مراحل عملية التنظيف، ومع ذلك يمكن أن يحصل الصحفيون على مجموعات بيانية ضخمة منسقة بشكل محترف يسهل استخدامها، بل ومن الممكن الحصول عليها من هيئات حكومية معنية بالإحصاءات.

هذا المنهج الدراسي، الذي يقدمه Journalist’s Resource، يغطي المهارات الأساسية اللازمة للعمل في غرف صناعة الأخبار ويقدم للطلبة ما يلزمهم حتى يصبحوا على إلمام ببرامج ذات صلة وأخرى متعلقة بالإحصاء وتقنيات التصميم والبرمجة، وبشكل عام كل ما يتصل بالمبادئ المتعلقة بالبيانات والفهم السليم لها.

تناولنا في الأجزاء الأربعة الأولى من هذه السلسلة المصادر الأساسية الواجب الاطلاع عليها من أجل الحصول على نظرة شاملة في المجال، والهدف من وراء هذا المنهج وتصميمه وبعض النصوص والإصدارات ومصادر البيانات، والبحث فيما وراء الأرقام وأهمية التفكير الناقد، والمهارات الأساسية اللازمة لمعالجة البيانات.

وفي هذا الجزء، سنتناول المنهج المخصص للأسبوع الدراسي الثالث الذي يتناول التحديات المرتبطة بطلبات الحصول على البيانات وتنظيفها وتحليلها.

 

الدرس الأول:

 

المطالعات:

١- قراءة مقال For Big-Data Scientists, ‘Janitor Work’ Is Key Hurdle to Insights، الذي نشرته صحيفة “نيويورك تايمز” الأمريكية، بقلم Steve Lohr.

٢- مشاهدة فيديو Let Lookup Save You from Boring, Repetitive Work You’ve Forgotten You’re Even Doing، الذي نشرته NICAR عام ٢٠١٦، ويقدمه Christopher Groskopf.

٣- مقال Key Data- and Research-Oriented Government Agencies that Media Members Should ،Know About المنشور في Journalist’s Resource.

٤- مشاهدة فيديو Finding Story Ideas in Large Datasets، المنشور في Stanford Journalism عام ٢٠١٦.

 

تمرين:

إن تقديم طلبات للاطلاع على السجلات العمومية هو جزء أساسي من صحافة البيانات، وينبغي على الطلبة مطالعة الأنشطة الخاصة بأحد المشروعات الحكومية المعنية بطلبات الحصول على المعلومات المُسمى “MuckRock“، بالإضافة إلى مشروع آخر اسمه “FOIA Mapper”، وكذلك تقديم طلب حصول على البيانات إلى MuckRock أو إلى الموقع الحكومي مباشرة.

 

الدرس الثاني:

 

المطالعات:

١- قراءة الصفحات من ٦٥ إلى ١١٢ من القسم الثالث في كتاب Data Literacy لمؤلفه David Herzog.

٢- قراءة Getting Data from the Web من دليل صحافة البيانات.

٣- قراءة Using Python to Scrape a Website and Gather Data: Practicing on a Criminal Justice Dataset، المنشورة في Journalist’s Resource عام ٢٠١٤.

٤- اختيار مقالات من The Upshot and Five Thirty Eight.

 

تمرين:

ينبغي على الطلبة تحميل نسخة من OpenRefine، وأن يحاولوا استخدامه في تنظيف بعض البيانات، وأن يستخدموا Tabula لاستخراج جداول البيانات الموجودة داخل ملفات PDF.

من الممكن أيضًا أن يستخدم الطلبة هذه الأدوات من أجل مراجعة المستندات والبيانات الخاصة بالهيئات الخيرية المحلية والمنظمات غير الهادفة للربح (انظر Investigating Nonprofits and Charities: Where to Find Internal Data, Public Records من Journalist’s Resource).

 

بعد الانتهاء من قراءات وتمارين هذا الأسبوع الدراسي، يمكن للطلبة الاطلاع على هذه القصة المعتمدة على البيانات: Where Police Have Killed Americans In 2015، المنشورة في Five Thirty Eight، بقلم Ben Casselman، ومجموعة بيانات Police Killings, FiveThirtyEight/data المنشورة في GitHub.

 

للاطلاع على الجزء الأول، اضغط هنا.
للاطلاع على الجزء الثاني، اضغط هنا.
للاطلاع على الجزء الثالث، اضغط هنا
للاطلاع على الجزء الرابع، اضغط هنا