نحن في الواقع لا نعُد المستخدمين، لكننا نعُد الطلبات التي يقوم بها العملاء بشكل دوري نحو الدلائل لتحديث قائمة مُرحّلاتهم وتقدير عدد المستخدمين بشكل غير مباشر من هناك.
لا، ولكن يمكننا أن نرى أي جزء من الأدلة التي أبلغ عنها، ومن ثم يمكننا استقراء العدد الإجمالي في الشبكة.
نحن نفترض أن العميل العادي يرسل 10 من هذه الطلبات يوميا.
يقوم عميل تور المتصل على مدار الساعة وطول أيام الأسبوع بإرسال حوالي 15 طلبا في اليوم، ولكن ليس كل العملاء متصلون على مدار الساعة وطول أيام الأسبوع، لذلك اخترنا العدد 10 للعميل العادي.
بساطة، نُقسِّم طلبات الدليل على 10 ونعتبر النتيجة هي عدد المستخدمين.
هناك طريقة أخرى للنظر للأمور، وهي أننا نفترض أن كل طلب يمثل عميلا يبقى متصلا بالانترنت لمدة عُشر اليوم، أي ساعتان و24 دقيقة.
يُقدَّر متوسط عدد المستخدمين في آن واحد، انطلاقا من البيانات التي تم جمعها على مدار يوم. لا يمكننا تحديد عدد أفراد المستخدمين .
لا، المُرحّلات التي تُبلغ عن هذه الإحصاءات تجمع الطلبات حسب بلد المنشأ وعلى مدار 24 ساعة.
ستكون الإحصاءات التي نحتاج إلى جمعها لعدد المستخدمين في الساعة مفصلة للغاية وقد تُعرّض المستخدمين للخطر.
ثم نعتبر هؤلاء المستخدمين واحدا. نحن نحسب العملاء حقا، لكن من البديهي أن يفكر معظم الناس في المستخدمين، ولهذا السبب نقول المستخدمين وليس العملاء.
لا، لأن هذا المستخدم يقوم بتحديث قائمة مُرحّلاته كثيرا، مثل أي مستخدم لا يغير عنوان IP على مدار اليوم.
تقوم الدلائل بتحويل عناوين IP إلى رموز البلدان والإبلاغ عن هذه الأرقام في شكل إجمالي. هذا هو أحد أسباب شحن تور مع قاعدة بيانات GeoIP.
يبلغ عدد قليل جدا من الجسور عن بيانات حول عمليات النقل أو إصدارات IP حتى الآن، نحن نأخذ مبدئيا في الاعتبار طلبات استخدام بروتوكول OR الافتراضي وIPv4.
بمجرد أن تُبلّغ الجسور عن هذه البيانات، ستصبح الأرقام أكثر دقة.
تقوم المُرحّلات والجسور بالإبلاغ عن بعض البيانات في فترات تبلغ 24 ساعة والتي قد تنتهي في أي وقت من اليوم.
وبعد انتهاء هذا الفاصل الزمني، قد تستغرق الجسور والمُرحّلات 18 ساعة أخرى للإبلاغ عن البيانات.
لقد أزلنا الرسوم البيانية في اليومين الأخيرين، لأننا نريد تجنب أن تشير آخر نقطة بيانات في الرسم البياني إلى تغيير حديث في التوجُّه وهو في الواقع مجرد ظاهرة للخوارزمية.
والسبب هو أننا ننشر أعداد المستخدمين بمجرد أن نكون واثقين بدرجة كافية من أنها لن تتغير بشكل كبير بعد الآن.
ولكن من الممكن دائما أن يقوم الدليل بالإبلاغ عن البيانات بعد بضع ساعات من ثقتنا بما فيه الكفاية، ولكنه بعد ذلك غيّر الرسم البياني قليلا.
لدينا أرشيفات للواصفات من قبل ذلك الوقت، لكن تلك الواصفات لم تتضمن جميع البيانات التي نستخدمها لتقدير أعداد المستخدمين.
لمزيد من التفاصيل، يُرجى الاطلاع على الأرشيف التالي:
أرشيف
بالنسبة للمستخدمين المباشرين، نقوم بإضافة جميع الأدلة التي لم نقم بها في المقاربة القديمة.
نستخدم أيضا سجلات تحتوي على بايْتات مكتوبة فقط للإجابة على طلبات الدليل، إذ ذلك أكثر دقة من استخدام سجلات البايْتات العامة.
حسنا، هذه قصة طويلة. كتبنا تقريرا تقنيا مكونا من 13 صفحة موضحين أسباب التخلي عن النهج القديم.
في النهج القديم، كنا لا نقيس الشيء الصحيح، والآن نقيسه.
إننا ندير نظاما لاكتشاف الرقابة، قائمٌ على الشذوذ، يبحث في تقدير أعداد المستخدمين على مدار سلسلة من الأيام، ويتوقع عدد المستخدمين في الأيام القادمة.
إذا كان الرقم الفعلي أعلى أو أقل، فقد يشير ذلك إلى احتمال حدوث الرقابة أو التخلي عنها.
لمزيد من التفاصيل، راجع تقريرنا الفني.