تويتر كمصدر لقصص صحفية مدفوعة بالبيانات

1 min read

يولد موقع التدوينات المُصغرة – تويتر –  الكثير من البيانات كل يوم. أكثر من 500 مليون تغريدة يوميًا من مختلف بلدان العالم لأكثر من 316 مليون مستخدم نشط. فهل من الممكن أن يتحول 140 حرفًا لمنجم من البيانات؟

عادة ما يستخدم الصحفيون تويتر في العمل الصحفي كأداة لبناء شبكة من المصادر المعنية بتغطية حدث معين، أو للبحث عن القصص المثيرة لاهتمام الجمهور ومتابعة اتجاهات الرأي العام بشأن قضية معينة. وكأنه وسيلة سهلة للدخول إلى عقل المغردين لمعرفة فيما يفكرون.

التغريدة منفردة تشكل معلومة حول حدث معين قد يكون صاحبها هو الفاعل الرئيسي أو شاهد عليها، لكن النظر لعدد أكبر من التغريدات حول نفس الحدث قد يشكل صورة مكتملة عنه، مثلًا عندما بدأ عدد من المغردين في التغريد عن وقائع التحرش التي تعرضوا لها عبر استخدام وسم موحد “metoo#” فكل تغريدة تمثل واقع تحرش قد تحتوي على معلومات عن نوع التحرش التي تعرض له المغرد وحالته النفسية تجاه هذا الحادث وردة فعله بعدها وربما تحتوي على موقع الواقعة وعمره حينها وصلة القرابة بينه وبين الفاعل والكثير والكثير من التفاصيل التي قد يسردها المغرد في تغريدته.

بانتزاع النص من تويتر ووضعه في قوالب مجدولة مكونة من صفوف وأعمدة نحصل بذلك على قاعدة بيانات، حينها يمكننا القول أننا بصدد منجم من البيانات يمكن من خلاله معرفة الكثير من المؤشرات والحقائق.

 

ثلاثة أسباب تجعل تويتر مصدرًا جيدًا للبيانات:

يسهل موقع تويتر العثور على التغريدات ومتابعتها من خلال خاصية البحث المتقدمة التي يوفرها الموقع مما يسهل الوصول لحدث معين ورصد التغريدات المتعلقة به.

تتمحور كافة التغريدات في موقع تويتر حول الهاشتاج، حيث يستخدم جميع المغردين على الأغلب وسمًا محددًا لموضوع معين مما يجعل عملية البحث حول موضوع محدد سهلة، حيث يسهل حصر النتائج حولها والبحث بداخلها وفرزها و استخراجها في صورة مجدولة.

يتميز الموقع بواجهة برمجية منفتحة تسهل على المبرمجين الولوج لقواعد البيانات والحصول على أرشيف التغريدات حول وسم معين أو أرشيف التغريدات المتعلق بشخص محدد، مقارنة مع منصات التواصل الاجتماعي الأخرى مما يجعله أكثر سهولة للحصول على بيانات مجدولة ومنظمة.

 

 استخراج البيانات من تويتر باستخدام موقع 

“netlytic”

هناك العديد من الأدوات التي تسمح لغير المبرمجين من استخراج التغريدات في صورة مجدولة لعل من أشهرها وأسهلها استخدامًا هو موقع “netlytic”، من خلال واجهة مستخدم سهلة يمكنك الموقع من تحديد الهاشتاج التي نود استخراج التغريدات التي نشرت حوله، وهنا يمكن كتابة أكثر من هاشتاج واحد حول موضوع محدد كما يمكن الدمج بين الهاشتاجات بلغات مختلفة لضمان حصر كافة التغريدات المنشورة.

كما يسهل الموقع عملية تحليل النص لتحديد الكلمات المميزة والكلمات الأكثر تكرارًا كذلك يعطي تحليل مشاعر المغردين إذا كانوا يتحدثون حول موضوع محدد بإيجابية أو بنظرة سلبية، هذا بالإضافة إلى أن الموقع يوفر خاصية تحليل شبكة العلاقات بين المغردين لمعرفة أكثر المغردين الذين ينشغلون بالتغريد عن موضوع محدد وكذلك علاقتهم بالمغردين الآخرين حول ذات الموضوع.

يوفر الموقع أكثر من فئة لاستخراج التغريدات تحتوي كل فئة منها على عدد محدود من التغريدات تصل في أقل فئة إلى 1000 تغريدة، وتأتي كافة التغريدات في صيغة جدول يحتوي على اسم المغرد ورابط التغريدة ونصها وموقعه الجغرافي وعدد التعليقات ومرات الإعجاب بالتغريدة وغيرها من البيانات التي يسمح موقع تويتر بالحصول عليها.

 

عمرو العراقي

عمل عمرو العراقي صحفيًّا لأكثر من عشر سنوات في عدد من غرف الأخبار الكبرى منها MBC وموقع YAHOO مكتوب، وفي نهاية عام انطلق للعمل الحر 2012 وأسس موقع InfoTimes أول موقع متخصص في صحافة البيانات في العالم العربي، بجانب وصوله إلى التصفيات النهائية لعامين على التوالي في مسابقة شبكة المحررين الدوليين لصحافة البيانات، ونشر له هذا العام كتاب “صحافة البيانات” كما ساهم العراقي في تدريب عدد من الصحفيين على تصميم البيانات بالتعاون مع BBC Media Action وشبكة Internews Europe.