أهمية إخفاء الهوية في البيانات ودوره في مكافحة الأمراض
لطالما كانت البيانات أداةً أساسيةً لفهم الأمراض ومكافحتها، من المخططات الإحصائية الدائرية التي رسمتها "فلورنس نايتينغيل" باليد للربط بين سوء الصرف الصحي وتفشّي الأمراض في أوائل القرن التاسع عشر، إلى مستودع البيانات المفتوح المصدر الأوّل من نوعه الذي تم إنشاؤه استجابةً لأزمة تفشّي مرض الإيبولا في غرب أفريقيا في عام 2014. ولا شكّ أنّ البيانات شكّلت جزءًا لا يتجزأ من الجهود المبذولة لمواجهة جائحة فيروس كورونا المستجد (كوفيد-19) منذ بدء انتشاره في ووهان.
سرعان ما بدأت مجموعة من الباحثين بتوثيق مراحل انتشار الفيروس منذ البداية وتعاونت معًا في جمع البيانات التي يمكن أن تساعد علماء الأوبئة من مختلف أنحاء العالم في تحديد مسار تفشّي هذا الفيروس المستجد. ولكن واجهت هذه المجموعة، التي تتضمّنت باحثين من جامعات "أوكسفورد" و"تسينغهوا" و"نورث إيسترن" ومستشفى بوسطن للأطفال وغيرها، تحديًا أساسيًا مع تزايد عدد الإصابات إذ لم تكن البنية الأساسية لعملها مصمّمة لاستيعاب هذا الارتفاع الهائل في الحالات.
ومن هنا لجأت المجموعة إلى Google.org للحصول على المساعدة وتم منحها تمويل بقيمة 1.25 مليون دولار كجزءٍ من مساهمات شركة Google في تقديم إجمالي 100 مليون دولار مساعدات لمكافحة "كوفيد-19"، كما تم تخصيص فريق من 10 أعضاء من برنامج Google.org Fellowship و7 متطوّعين بدوام جزئي من موظفي Google لمساعدة الباحثين في مشروعهم.
وكانت نتيجة هذا التعاون بين متطوّعي Google والباحثين إنشاء منصة Global.health، وهي منصة مفتوحة للجميع تضم بيانات عن ملايين حالات الإصابة بفيروس كورونا المستجد من أكثر من 100 بلد حول العالم بدون الكشف عن هوية المصابين. والهدف من هذه المنصة هو مساعدة علماء الأوبئة من مختلف أنحاء العالم في تحديد مسار تفشّي الجائحة وتتبّع متغيرات وطفرات الفيروس والأمراض المعدية المحتمل تفشّيها في المستقبل.
الحاجة إلى بيانات موثوقة وغير محدِّدة للهوية عن حالات الإصابة
عند تفشّي أي مرض، يكون الوصول السريع إلى البيانات المنظّمة والموثوقة وغير المحدِّدة للهوية خطوةً أساسيةً وبالغة الأهمية حتّى يتمكّن أصحاب القرار في مجال الصحة العامة من تشكيل السياسات واتّخاذ الإجراءات الوقائية والطبية بشكل استباقي وتخصيص الموارد اللازمة لتحقيق ذلك وإبطاء وتيرة انتشار المرض وإنقاذ الأرواح. وعلى خلاف البيانات المجمّعة العامة مثل عدد الحالات، فإنّ توفّر معلومات وإحصاءات مستندة إلى قوائم تفصيلية (line-lists)، مثل معلومات عن كل إصابة على حدة بدون الكشف عن هوية المصابين، يعدّ أمرًا أساسيًا لمساعدة علماء الأوبئة في تحليل المعلومات بشكل أكثر تقصيلاً ودقة من أجل تحديد فعالية الإجراءات المتّخذة.
بدأ المتطوّعون في "جامعة أوكسفورد" بتنظيم البيانات يدويًا، ولكن سرعان ما انتشرت على مئات المواقع الإلكترونية وفي عشرات التنسيقات واللغات. وبدوره، استطاع فريق HealthMap من مستشفى بوسطن للأطفال إعداد تقارير مبكرة حول "كوفيد-19" من خلال فهرسة المواقع الإلكترونية الإخبارية والمصادر الرسمية بشكل آلي. وتعاون هذان الفريقان معًا من أجل تبادل البيانات ونشر النتائج التي تمت مراجعتها من قِبل خبراء في المجال لإنشاء مصدر موحّد موثوق يمكن للمجتمع الدولي الرجوع إليه.
الانضمام إلى برنامج Google.org Fellowship
في إطار المساعي لمساعدة الباحثين من مختلف أنحاء العالم في جهودهم القيّمة، قرّرت Google.org تخصيص فريق من 10 أعضاء من برنامج Google.org Fellowship للعمل بدوام كامل على منصة Global.health لمدّة 6 أشهر، كما ساهمت بمبلغ 1.25 مليون دولار في المشروع. وعمل فريق Google.org عن كثب مع "جامعة أوكسفورد" ومستشفى بوسطن للأطفال، وتواصل مع نخبة من الباحثين والمسؤولين في مجال الصحة العامة لفهم التحديات التي تواجههم في إيجاد بيانات موثوقة عالية الجودة واستخدامها، إذ غالبًا ما يضطرون إلى إجراء ذلك يدويًا وهو ما يستغرق الكثير من الوقت والجهد.
تعتبر حماية خصوصية البيانات من أهم الأولويات في منصة Global.health. فهي تجمع بياناتها من مصادر مفتوحة تابعة لهيئات صحة عامة موثوقة ويعمل فريق من الخبراء في المنصة على مراجعة هذه البيانات بدقة للتأكّد من أنها تستوفي المتطلّبات الصارمة لإخفاء الهوية. وساعد فريق Google.org في تصميم عملية نقل البيانات واستيعابها لضمان اتّباع أفضل الممارسات في التحقّق من صحة البيانات وجودتها وعدم احتوائها على أي معلومات شخصية. وإنّ جميع البيانات التفصيلية التي تتم إضافتها إلى المنصة محفوظة في البنية التحتية الآمنة للبيانات لدى مستشفى بوسطن للأطفال، وليس لدى Google.
معًا نتطلّع إلى المستقبل
بفضل الدعم الكبير من Google.org ومؤسسة The Rockefeller Foundation، أصبحت منصة Global.health بمثابة مركز دولي يجمع الباحثين من أهم الجامعات في إعداد قاعدة بيانات تفصيلية هي الأكثر شمولية في العالم حول فيروس كورونا المستجد (كوفيد-19). وتتضمّن قاعدة البيانات هذه ملايين السجلات غير المحدِّدة للهوية من
مصادر موثوقة تغطّي أكثر من 100 بلد، ومن بينها مصر، حيث بلغت نسبة البيانات التفصيلية حوالي 18% من إجمالي البيانات حول العالم.
واليوم، تساعد Global.health الباحثين حول العالم في الوصول إلى البيانات في غضون دقائق وبمنتهى السهولة. وتتميّز هذه المنصة بالمرونة إذ تم تصميمها بشكل يتيح لها استيعاب أي بيانات جديدة أو معلومات محلية عن تفشّي مرض معدي جديد. وتشكّل Global.health مركزًا أساسيًا للباحثين ومسوؤلي الصحة العامة للوصول إلى هذه البيانات بغض النظر عن مكان تواجدهم، سواء كانوا في نيويورك أو ساو باولو أو ميونيخ أو كيوتو أو نيروبي.
The important role of anonymized data in fighting disease
Data has always been a vital tool in understanding and fighting disease — from Florence Nightingale’s 1800s hand drawn illustrations that showed how poor sanitation contributed to preventable diseases to the first open source repository of data developed in response to the 2014 Ebola crisis in West Africa. When the first cases of COVID-19 were reported in Wuhan, data again became one of the most critical tools to combat the pandemic.
A group of researchers, who documented the initial outbreak, quickly joined forces and started collecting data that could help epidemiologists around the world model the trajectory of the novel coronavirus outbreak. The researchers came from University of Oxford, Tsinghua University, Northeastern University and Boston Children’s Hospital, among others.
However, their initial workflow was not designed for the exponential rise in cases. The researchers turned to Google.org for help. As part of Google’s $100 million contribution to COVID relief, Google.org granted $1.25 million in funding and provided a team of 10 fulltime Google.org Fellows and 7 part-time Google volunteers to assist with the project.
Google volunteers worked with the researchers to create Global.health, a scalable and open-access platform that pulls together millions of anonymized COVID-19 cases from over 100 countries. This platform helps epidemiologists around the world model the trajectory of COVID-19, and track its variants and future infectious diseases.
The need for trusted and anonymized case data
When an outbreak occurs, timely access to organized, trustworthy and anonymized data is critical for public health leaders to inform early policy decisions, medical interventions, and allocations of resources — all of which can slow disease spread and save lives. The insights derived from “line-list” data (e.g. anonymized case level information), as opposed to aggregated data such as case counts, are essential for epidemiologists to perform more detailed statistical analyses and model the effectiveness of interventions.
Volunteers at the University of Oxford started manually curating this data, but it was spread over hundreds of websites, in dozens of formats, in multiple languages. The HealthMap team at Boston Children’s Hospital also identified early reports of COVID-19 through automated indexing of news sites and official sources. These two teams joined forces, shared the data, and published peer-reviewed findings to create a trusted resource for the global community.
Enter the Google.org Fellowship
To help the global community of researchers in this meaningful endeavour, Google.org decided to offer the support of 10 Google.org Fellows who spent 6 months working full-time on Global.health, in addition to $1.25M in grant funding. Working hand in hand with the University of Oxford and Boston Children’s Hospital, the Google.org team spoke to researchers and public health officials working on the frontline to understand real-life challenges they faced when finding and using high-quality trusted data — a tedious and manual process that often takes hours.
Upholding data privacy is key to the platform’s design. The anonymized data used at Global.health comes from open-access authoritative public health sources, and a panel of data experts rigorously checks it to make sure it meets strict anonymity requirements. The Google.org Fellows assisted the Global.health team to design the data ingestion flow to implement best practices for data verification and quality checks to make sure that no personal data made its way into the platform. (All line-list data added to the platform is stored and hosted in Boston Children’s Hospital’s secure data infrastructure, not Google’s.)
Looking to the Future
With the support of Google.org and The Rockefeller Foundation, Global.health has grown into an international consortium of researchers at leading universities curating the most comprehensive line-list COVID-19 database in the world. It includes millions of anonymized records from trusted sources spanning over 100 countries, including Egypt which contributes to 18% of the total cases globally on the dashboard.
Today, Global.health helps researchers across the globe access data in a matter of minutes and a series of clicks. The flexibility of the Global.health platform means that it can be adapted to any infectious disease data and local context as new outbreaks occur.
لطالما كانت البيانات أداةً أساسيةً لفهم الأمراض ومكافحتها، من المخططات الإحصائية الدائرية التي رسمتها "فلورنس نايتينغيل" باليد للربط بين سوء الصرف الصحي وتفشّي الأمراض في أوائل القرن التاسع عشر، إلى مستودع البيانات المفتوح المصدر الأوّل من نوعه الذي تم إنشاؤه استجابةً لأزمة تفشّي مرض الإيبولا في غرب أفريقيا في عام 2014. ولا شكّ أنّ البيانات شكّلت جزءًا لا يتجزأ من الجهود المبذولة لمواجهة جائحة فيروس كورونا المستجد (كوفيد-19) منذ بدء انتشاره في ووهان.
سرعان ما بدأت مجموعة من الباحثين بتوثيق مراحل انتشار الفيروس منذ البداية وتعاونت معًا في جمع البيانات التي يمكن أن تساعد علماء الأوبئة من مختلف أنحاء العالم في تحديد مسار تفشّي هذا الفيروس المستجد. ولكن واجهت هذه المجموعة، التي تتضمّنت باحثين من جامعات "أوكسفورد" و"تسينغهوا" و"نورث إيسترن" ومستشفى بوسطن للأطفال وغيرها، تحديًا أساسيًا مع تزايد عدد الإصابات إذ لم تكن البنية الأساسية لعملها مصمّمة لاستيعاب هذا الارتفاع الهائل في الحالات.
ومن هنا لجأت المجموعة إلى Google.org للحصول على المساعدة وتم منحها تمويل بقيمة 1.25 مليون دولار كجزءٍ من مساهمات شركة Google في تقديم إجمالي 100 مليون دولار مساعدات لمكافحة "كوفيد-19"، كما تم تخصيص فريق من 10 أعضاء من برنامج Google.org Fellowship و7 متطوّعين بدوام جزئي من موظفي Google لمساعدة الباحثين في مشروعهم.
وكانت نتيجة هذا التعاون بين متطوّعي Google والباحثين إنشاء منصة Global.health، وهي منصة مفتوحة للجميع تضم بيانات عن ملايين حالات الإصابة بفيروس كورونا المستجد من أكثر من 100 بلد حول العالم بدون الكشف عن هوية المصابين. والهدف من هذه المنصة هو مساعدة علماء الأوبئة من مختلف أنحاء العالم في تحديد مسار تفشّي الجائحة وتتبّع متغيرات وطفرات الفيروس والأمراض المعدية المحتمل تفشّيها في المستقبل.
الحاجة إلى بيانات موثوقة وغير محدِّدة للهوية عن حالات الإصابة
عند تفشّي أي مرض، يكون الوصول السريع إلى البيانات المنظّمة والموثوقة وغير المحدِّدة للهوية خطوةً أساسيةً وبالغة الأهمية حتّى يتمكّن أصحاب القرار في مجال الصحة العامة من تشكيل السياسات واتّخاذ الإجراءات الوقائية والطبية بشكل استباقي وتخصيص الموارد اللازمة لتحقيق ذلك وإبطاء وتيرة انتشار المرض وإنقاذ الأرواح. وعلى خلاف البيانات المجمّعة العامة مثل عدد الحالات، فإنّ توفّر معلومات وإحصاءات مستندة إلى قوائم تفصيلية (line-lists)، مثل معلومات عن كل إصابة على حدة بدون الكشف عن هوية المصابين، يعدّ أمرًا أساسيًا لمساعدة علماء الأوبئة في تحليل المعلومات بشكل أكثر تقصيلاً ودقة من أجل تحديد فعالية الإجراءات المتّخذة.
بدأ المتطوّعون في "جامعة أوكسفورد" بتنظيم البيانات يدويًا، ولكن سرعان ما انتشرت على مئات المواقع الإلكترونية وفي عشرات التنسيقات واللغات. وبدوره، استطاع فريق HealthMap من مستشفى بوسطن للأطفال إعداد تقارير مبكرة حول "كوفيد-19" من خلال فهرسة المواقع الإلكترونية الإخبارية والمصادر الرسمية بشكل آلي. وتعاون هذان الفريقان معًا من أجل تبادل البيانات ونشر النتائج التي تمت مراجعتها من قِبل خبراء في المجال لإنشاء مصدر موحّد موثوق يمكن للمجتمع الدولي الرجوع إليه.
الانضمام إلى برنامج Google.org Fellowship
في إطار المساعي لمساعدة الباحثين من مختلف أنحاء العالم في جهودهم القيّمة، قرّرت Google.org تخصيص فريق من 10 أعضاء من برنامج Google.org Fellowship للعمل بدوام كامل على منصة Global.health لمدّة 6 أشهر، كما ساهمت بمبلغ 1.25 مليون دولار في المشروع. وعمل فريق Google.org عن كثب مع "جامعة أوكسفورد" ومستشفى بوسطن للأطفال، وتواصل مع نخبة من الباحثين والمسؤولين في مجال الصحة العامة لفهم التحديات التي تواجههم في إيجاد بيانات موثوقة عالية الجودة واستخدامها، إذ غالبًا ما يضطرون إلى إجراء ذلك يدويًا وهو ما يستغرق الكثير من الوقت والجهد.
تعتبر حماية خصوصية البيانات من أهم الأولويات في منصة Global.health. فهي تجمع بياناتها من مصادر مفتوحة تابعة لهيئات صحة عامة موثوقة ويعمل فريق من الخبراء في المنصة على مراجعة هذه البيانات بدقة للتأكّد من أنها تستوفي المتطلّبات الصارمة لإخفاء الهوية. وساعد فريق Google.org في تصميم عملية نقل البيانات واستيعابها لضمان اتّباع أفضل الممارسات في التحقّق من صحة البيانات وجودتها وعدم احتوائها على أي معلومات شخصية. وإنّ جميع البيانات التفصيلية التي تتم إضافتها إلى المنصة محفوظة في البنية التحتية الآمنة للبيانات لدى مستشفى بوسطن للأطفال، وليس لدى Google.
معًا نتطلّع إلى المستقبل
بفضل الدعم الكبير من Google.org ومؤسسة The Rockefeller Foundation، أصبحت منصة Global.health بمثابة مركز دولي يجمع الباحثين من أهم الجامعات في إعداد قاعدة بيانات تفصيلية هي الأكثر شمولية في العالم حول فيروس كورونا المستجد (كوفيد-19). وتتضمّن قاعدة البيانات هذه ملايين السجلات غير المحدِّدة للهوية من
مصادر موثوقة تغطّي أكثر من 100 بلد، ومن بينها مصر، حيث بلغت نسبة البيانات التفصيلية حوالي 18% من إجمالي البيانات حول العالم.
واليوم، تساعد Global.health الباحثين حول العالم في الوصول إلى البيانات في غضون دقائق وبمنتهى السهولة. وتتميّز هذه المنصة بالمرونة إذ تم تصميمها بشكل يتيح لها استيعاب أي بيانات جديدة أو معلومات محلية عن تفشّي مرض معدي جديد. وتشكّل Global.health مركزًا أساسيًا للباحثين ومسوؤلي الصحة العامة للوصول إلى هذه البيانات بغض النظر عن مكان تواجدهم، سواء كانوا في نيويورك أو ساو باولو أو ميونيخ أو كيوتو أو نيروبي.
The important role of anonymized data in fighting disease
Data has always been a vital tool in understanding and fighting disease — from Florence Nightingale’s 1800s hand drawn illustrations that showed how poor sanitation contributed to preventable diseases to the first open source repository of data developed in response to the 2014 Ebola crisis in West Africa. When the first cases of COVID-19 were reported in Wuhan, data again became one of the most critical tools to combat the pandemic.
A group of researchers, who documented the initial outbreak, quickly joined forces and started collecting data that could help epidemiologists around the world model the trajectory of the novel coronavirus outbreak. The researchers came from University of Oxford, Tsinghua University, Northeastern University and Boston Children’s Hospital, among others.
However, their initial workflow was not designed for the exponential rise in cases. The researchers turned to Google.org for help. As part of Google’s $100 million contribution to COVID relief, Google.org granted $1.25 million in funding and provided a team of 10 fulltime Google.org Fellows and 7 part-time Google volunteers to assist with the project.
Google volunteers worked with the researchers to create Global.health, a scalable and open-access platform that pulls together millions of anonymized COVID-19 cases from over 100 countries. This platform helps epidemiologists around the world model the trajectory of COVID-19, and track its variants and future infectious diseases.
The need for trusted and anonymized case data
When an outbreak occurs, timely access to organized, trustworthy and anonymized data is critical for public health leaders to inform early policy decisions, medical interventions, and allocations of resources — all of which can slow disease spread and save lives. The insights derived from “line-list” data (e.g. anonymized case level information), as opposed to aggregated data such as case counts, are essential for epidemiologists to perform more detailed statistical analyses and model the effectiveness of interventions.
Volunteers at the University of Oxford started manually curating this data, but it was spread over hundreds of websites, in dozens of formats, in multiple languages. The HealthMap team at Boston Children’s Hospital also identified early reports of COVID-19 through automated indexing of news sites and official sources. These two teams joined forces, shared the data, and published peer-reviewed findings to create a trusted resource for the global community.
Enter the Google.org Fellowship
To help the global community of researchers in this meaningful endeavour, Google.org decided to offer the support of 10 Google.org Fellows who spent 6 months working full-time on Global.health, in addition to $1.25M in grant funding. Working hand in hand with the University of Oxford and Boston Children’s Hospital, the Google.org team spoke to researchers and public health officials working on the frontline to understand real-life challenges they faced when finding and using high-quality trusted data — a tedious and manual process that often takes hours.
Upholding data privacy is key to the platform’s design. The anonymized data used at Global.health comes from open-access authoritative public health sources, and a panel of data experts rigorously checks it to make sure it meets strict anonymity requirements. The Google.org Fellows assisted the Global.health team to design the data ingestion flow to implement best practices for data verification and quality checks to make sure that no personal data made its way into the platform. (All line-list data added to the platform is stored and hosted in Boston Children’s Hospital’s secure data infrastructure, not Google’s.)
Looking to the Future
With the support of Google.org and The Rockefeller Foundation, Global.health has grown into an international consortium of researchers at leading universities curating the most comprehensive line-list COVID-19 database in the world. It includes millions of anonymized records from trusted sources spanning over 100 countries, including Egypt which contributes to 18% of the total cases globally on the dashboard.
Today, Global.health helps researchers across the globe access data in a matter of minutes and a series of clicks. The flexibility of the Global.health platform means that it can be adapted to any infectious disease data and local context as new outbreaks occur.