طلب تفاصيل

تواصل معنا

يرجى ملء النموذج أدناه إذا كان لديك خطة أو مشروع في الاعتبار وترغب في مشاركته معنا

تابعنا على:

Abdullah
مدة القراءة: 18 دقيقة | 15
blog images

فتحت Google Search Console وشفت صفحات من موقعك في قسم “Discovered but not indexed” وعملت كل الخطوات الصح، ومع ذلك أرشفة الموقع مش بتحصل.

96.55% من الصفحات على الإنترنت لا تحصل على أي زيارة من جوجل مش لأن المحتوى وحش، لكن لأن جوجل لم تُأرشفها أصلاً، وده رقم حقيقي من دراسة Ahrefs على أكثر من مليار صفحة.

الأرشفة هي الخطوة الصفر بدونها كل تعبك في المحتوى والكلمات المفتاحية غير موجود في عيون جوجل. هنا هتعرف إزاي تأرشف موقعك بسرعة، ليه صفحات بتتأخر حتى لو عملت كل حاجة صح، والأسباب الخفية اللي محدش بيتكلم عنها بالعربي.

إزاي جوجل بتكتشف موقعك الزحف والأرشفة ببساطة

قبل ما نتكلم عن أي خطوة، لازم تفهم إزاي جوجل بتشتغل لأن كتير من الناس بتعمل الخطوات الصح من غير ما تفهم ليه.

جوجل عندها برامج اسمها Crawlers أو Spiders تخيّلها زي روبوتات بتتجول على الإنترنت وبتزور المواقع. لما الروبوت ده بيزور موقعك، بيقرأ المحتوى ويحفظه في قاعدة بيانات ضخمة اسمها Index. ده اللي بنسميه الأرشفة أو الفهرسة.

العملية بتمر بـ 3 مراحل متتالية ولو أي مرحلة اتوقفت، الصفحة مش هتظهر في نتائج البحث:

  • الزحف (Crawling): جوجل بتكتشف صفحتك وبتزورها. الروبوت بيتبع الروابط من صفحة للتانية، لذلك الصفحة اللي مش مرتبطة بأي صفحة تانية ممكن ماتتزورش.
  • المعالجة (Processing): جوجل بتفهم محتوى الصفحة وعلاقتها بالصفحات التانية. هنا بتحدد الموضوع والكلمات المفتاحية والجودة.
  • الأرشفة (Indexing): جوجل بتحفظ الصفحة في الـ Index وبتبدأ تعرضها في نتائج البحث لو قررت إنها تستاهل.

المشكلة إن الناس بتفكر إن الـ 3 مراحل دي بتحصل أوتوماتيك وبسرعة. الحقيقة إن في حاجات كتير ممكن توقف أي مرحلة منهم من غير ما تحس.

فرق مهم موقع جديد vs صفحة غير مؤرشفة

ده الفرق اللي محدش بيوضحه وهو اللي بيحدد الحل الصح. معرفة إنت في أنهي حالة بيوفر عليك أسابيع من الانتظار الغلط.

المعيار موقع جديد صفحة موجودة غير مؤرشفة
المشكلة جوجل مش شايفاك أصلاً جوجل شايفة الموقع لكن في مشكلة في الصفحة
الحل Search Console + Sitemap + أول Backlink اكتشاف سبب المشكلة وإصلاحه أولاً
الوقت المتوقع أسبوع لشهر يومين لأسبوعين بعد الإصلاح
الخطأ الشائع الانتظار من غير ما تعرّف نفسك لجوجل رفع Sitemap من غير ما تصلح المشكلة الأصلية
أداة التشخيص site:yourdomain.com في جوجل فحص عنوان URL في Search Console

الخطوات الأساسية لأرشفة سريعة خطوة بخطوة

الخطوة 1: ربط موقعك بـ Google Search Console

ده أهم حاجة تعملها قبل أي حاجة تانية. اربط موقعك بـ Google Search Console، وبعدها استخدم خاصية “فحص عنوان URL” وابعت الصفحة لجوجل مباشرة. ده بيقصّر وقت الأرشفة من أسابيع لأيام أو حتى ساعات.

  1. افتح Search Console وادخل على الموقع بتاعك
  2. في شريط البحث في الأعلى، الصق رابط الصفحة اللي عايز تأرشفها
  3. اضغط Enter وانتظر جوجل تفحص الرابط
  4. لو ظهر “عنوان URL غير متوفر في Google” اضغط “طلب الفهرسة”
  5. لو ظهر خطأ أو تحذير اقرأ السبب قبل ما تطلب الفهرسة

تنبيه مهم: لو بعتت الصفحة وجوجل قالتلك “عنوان URL غير متوفر في Google” مش معناها إنها بتتأرشف. معناها إنها لقت مشكلة. اقرأ السبب بالتفصيل.

الخطوة 2: رفع Sitemap وتفعيل التحديث التلقائي

الـ Sitemap هو خريطة موقعك بيقول لجوجل “في عندي الصفحات دي، روح شوفها.” أي موقع ووردبريس بيتولد Sitemap أوتوماتيك من خلال Rank Math أو Yoast على الرابط: yourdomain.com/sitemap.xml

  1. افتح Search Console ← “Sitemaps” من القائمة الجانبية
  2. الصق رابط الـ Sitemap الخاص بيك
  3. اضغط “إرسال”
  4. تأكد إن الحالة “تم النجاح” وإن عدد الصفحات المكتشفة منطقي

تنبيه مهم: لو الـ Sitemap عنده أخطاء في Search Console صفحات كتير ممكن تكون مش واصلة لجوجل خالص حتى لو إنت مش حاسس.

الخطوة 3: مراجعة ملف robots.txt

ملف robots.txt بيقول لجوجل “الصفحات دي ادخلها والصفحات دي متدخلش.” خطأ واحد فيه ممكن يمنع أرشفة موقعك كله.

مثال على ملف robots.txt صح:

User-agent: *
Disallow: /admin/
Disallow: /cart/
Disallow: /checkout/
Allow: /
Sitemap: https://yourdomain.com/sitemap.xml

تنبيه مهم: افتح yourdomain.com/robots.txt وتأكد إن مفيش Disallow: / لو موجودة يعني إنت حاجب كل الموقع عن جوجل.

الخطوة 4: Internal Linking من صفحات متأرشفة

لما بتنشر صفحة جديدة، اربطها من صفحة قديمة متأرشفة. ده بيخلي جوجل تلاقي الصفحة الجديدة أسرع بكتير.

  • بعد ما تنشر، روح على أقرب 2-3 مقالات موجودة بنفس الموضوع
  • أضف جملة طبيعية في المقال القديم بتشير للصفحة الجديدة
  • استخدم anchor text وصفي يحتوي على الكلمة المفتاحية للصفحة الجديدة
  • ابعت المقالات القديمة دي من Search Console بعد التعديل

تنبيه مهم: الصفحة اللي مش مرتبطة بأي صفحة تانية في الموقع جوجل ممكن ماتلاقيهاش أبداً حتى لو هي موجودة في الـ Sitemap.

الخطوة 5: الحصول على أول Backlink خارجي

لو موقعك جديد أول Backlink من موقع متأرشف بيفرق كتير. مش محتاج موقع كبير، محتاج موقع متأرشف في جوجل بيلينك ليك.

  • دليل مواقع عربي متأرشف في جوجل
  • مقال ضيف على موقع في نفس مجالك
  • ذكر موقعك في منتدى أو مجموعة متخصصة
  • صفحة على مواقع زي Crunchbase أو LinkedIn Company

تنبيه مهم: لو موقعك عنده صفر Backlinks وصفر Internal Links على صفحة معينة جوجل مش هتلاقيها حتى لو عملت كل حاجة تانية صح.

Crawl Budget إيه هو وليه بيأثر عليك بالأرقام

جوجل مش بتزحف على كل الصفحات كل يوم. عندها “ميزانية زحف” محددة لكل موقع بتحدد كام صفحة هتزحف عليها في اليوم الواحد.

مثال عددي واقعي: موقع عنده 500 صفحة وجوجل خصصتله ميزانية 100 صفحة/يوم يعني جوجل هتاخد 5 أيام عشان تزحف على الموقع كله مرة واحدة. لو في الـ 100 صفحة دي 30 صفحة خطأ 404 و20 صفحة فلترة فاضية جوجل بتضيّع 50% من ميزانيتها على صفحات مش مفيدة.

العامل التأثير على Crawl Budget الأولوية
صفحات 404 وأخطاء بتاكل الميزانية من غير فايدة عالية جداً
سرعة الموقع البطيئة صفحات أقل يومياً عالية جداً
صفحات الفلترة والتاجات بتضيّع الميزانية على صفحات مش مهمة عالية
محتوى ضعيف بكميات كبيرة بيقلل ثقة جوجل في الموقع كله عالية
Redirect مكسورة بتبطّئ الزحف وبتضيّع وقت الروبوت متوسطة
Internal Links منظمة بتساعد جوجل توزع الميزانية صح محسّن ✅
  • احذف أو اعمل noindex للصفحات الضعيفة اللي مش بتجيب قيمة
  • أصلح صفحات الـ 404 واعمل Redirect 301 للصفحات المكسورة
  • حسّن سرعة موقعك كل ثانية بتتوفر = صفحات أكتر جوجل بتزحف عليها
  • امنع أرشفة صفحات الفلترة والتاجات عبر robots.txt أو noindex

الأسباب الخفية اللي بتمنع الأرشفة

دي الأسباب اللي الناس بتعمل كل الخطوات الصح ومع ذلك صفحاتها مش بتتأرشف. معظمها مش واضح من غير ما تدور عليه بشكل متعمد.

أولاً Noindex خطأ

أحياناً بيكون في تاج noindex في صفحة مهمة من غير قصد ممكن يكون جه من إعدادات إضافة السيو أو من المطور وقت التطوير ونسي يشيله. جوجل بتشوف الـ noindex وبتتجاهل الصفحة تماماً حتى لو محتواها ممتاز.

إزاي تكتشفه: افتح Search Console ← “الفهرسة” ← شوف الصفحات اللي حالتها “مستبعدة بسبب علامة noindex.”

ثانياً Canonical Tag غلط

الـ Canonical Tag بيقول لجوجل “الصفحة الأصلية هنا.” لو الـ Canonical بيشاور على صفحة تانية جوجل هتأرشف الصفحة التانية مش صفحتك. ده بيحصل كتير في مواقع التجارة الإلكترونية اللي عندها صفحات منتجات متشابهة أو صفحات فلترة.

إزاي تكتشفه: افتح الصفحة ← اعمل View Source ← ابحث عن كلمة “canonical” وشوف بيشاور على إيه بالظبط.

ثالثاً JavaScript Rendering

لو موقعك بيحمّل المحتوى بالـ JavaScript جوجل ممكن متشوفش المحتوى ده. روبوتات جوجل بتحتاج وقت أكتر لمعالجة الـ JavaScript مقارنة بالـ HTML العادي، وأحياناً بتتجاهل المحتوى اللي بيتحمل بعد أول تحميل للصفحة.

إزاي تكتشفه: افتح “فحص عنوان URL” في Search Console ← اضغط “عرض الصفحة المُعالجة” ← لو المحتوى مش ظاهر أو ناقص، في مشكلة JavaScript.

رابعاً محتوى ضعيف جوجل قررت إنه مش يستاهل

جوجل مش ملزمة تأرشف كل صفحة. لو الصفحة قصيرة جداً أو بتتكرر في مواقع تانية أو مش بتقدم قيمة حقيقية جوجل ممكن تقرر إنها “Discovered but not indexed.” ده مش عقوبة ده جوجل بتقولك إن الصفحة دي مش كافية.

مثال عملي: صفحة منتج بـ 50 كلمة بس واسم المنتج والسعر جوجل غالباً مش هتأرشفها. نفس الصفحة لو فيها 300 كلمة + مواصفات تفصيلية + FAQ + مراجعات = فرصة أرشفة أعلى بكتير.

السبب أداة الكشف الحل السريع الوقت للإصلاح
Noindex خطأ Search Console ← الفهرسة احذف التاج من الصفحة يومين بعد الإصلاح
Canonical غلط View Source ← canonical صحّح يشاور على الصفحة الصح أسبوع بعد الإصلاح
JavaScript Rendering Search Console ← عرض الصفحة المُعالجة Server-Side Rendering أسبوعين
محتوى ضعيف Search Console ← Discovered not indexed حسّن المحتوى وابعته يدوي أسبوع لأسبوعين
robots.txt حاجب yourdomain.com/robots.txt احذف Disallow: / أيام
Redirect مكسورة Screaming Frog / Search Console أصلح الـ Redirect أو احذف الصفحة أيام

إزاي تقرأ تقرير الزحف في Search Console

كتير من الناس بيفتحوا Search Console لكن مش بيعرفوا يفسّروا الأرقام وده بيخليهم يتصرفوا غلط أو ميتصرفوش خالص. كل حالة في تقرير الفهرسة ليها معنى مختلف وحل مختلف.

الحالة في Search Console معناها بالظبط الخطوة الجاية
Indexed الصفحة متأرشفة وظاهرة في جوجل راقب الأداء وحسّن المحتوى
Discovered – currently not indexed جوجل شافت الصفحة لكن لسه ما زحفتش ضغط على الـ Crawl Budget حسّن المحتوى + اربط داخلياً + ابعت يدوي
Crawled – currently not indexed جوجل زارت الصفحة وقررت إنها مش تستاهل الأرشفة حسّن المحتوى بشكل جذري المشكلة في الجودة
Excluded by noindex tag في تاج noindex في الصفحة شيل التاج لو الصفحة مهمة
Duplicate – not selected as canonical جوجل اختارت صفحة تانية كـ canonical بدلك صحّح الـ Canonical Tag
Page with redirect الصفحة بتعمل redirect لصفحة تانية لو مقصود ← تمام. لو خطأ ← صلّحه
Not found (404) الصفحة مش موجودة أعدها أو اعمل Redirect 301 لصفحة مشابهة
Blocked by robots.txt الـ robots.txt حاجب الصفحة راجع الـ robots.txt وأزل الحجب لو مش مقصود

الفرق المهم: Discovered يعني جوجل شايفة الصفحة لكن لسه ما زارتهاش المشكلة في الـ Crawl Budget. Crawled not indexed يعني جوجل زارت الصفحة وقررت إنها مش تستاهل المشكلة في جودة المحتوى. الحلين مختلفين تماماً.

أرشفة المحتوى العربي تحديات خاصة

الموضوع ده غايب تقريباً من كل المقالات العربية عن الأرشفة وهو بيأثر على مواقع كتير من غير ما أصحابها يعرفوا.

مشكلة hreflang في المواقع ثنائية اللغة

لو موقعك عنده نسخة عربية وإنجليزية، لازم تستخدم تاج hreflang صح. من غيره، جوجل ممكن تعتبر الصفحتين محتوى مكرر وتتأخر في أرشفة الاتنين أو تأرشف واحدة بس.

<link rel="alternate" hreflang="ar" href="https://yourdomain.com/ar/page/" />
<link rel="alternate" hreflang="en" href="https://yourdomain.com/en/page/" />
<link rel="alternate" hreflang="x-default" href="https://yourdomain.com/page/" />

الكلمات المتشابهة والمحتوى المكرر عربياً

اللغة العربية عندها تحدي خاص نفس الكلمة ممكن تتكتب بأشكال مختلفة: “إيميل” و”ايميل” و”بريد إلكتروني.” لو موقعك عنده صفحات متعددة بنفس الموضوع بصياغات مختلفة، ممكن يتعامل معاهم كـ Duplicate Content. الأفضل توحيد الكتابة والدمج في صفحة واحدة قوية.

التشكيل والأرشفة

الكلمات بالتشكيل وبدون التشكيل بتتعامل معاهم جوجل كنصوص مختلفة في بعض الحالات. الأفضل دايماً تكتب المحتوى بدون تشكيل إلا في الحالات اللي التشكيل فيها ضروري للفهم، وتوحّد أسلوب الكتابة في كل الموقع.

روابط المواقع العربية والـ Backlinks

المواقع العربية المتأرشفة وعندها سلطة كافية أقل عدداً مقارنة بالمحتوى الإنجليزي وده بيعني إن بناء Backlinks عربي حقيقي أصعب لكن قيمته أعلى. رابط واحد من موقع عربي موثوق في نفس مجالك بيفرق أكتر من 10 روابط من مواقع عشوائية.

الفرق بين أرشفة المدونات ومواقع التجارة الإلكترونية

المعيار المدونات التجارة الإلكترونية
طبيعة المحتوى ثابت نسبياً وصفحات أقل صفحات بتتغير باستمرار منتجات ومخزون وأسعار
التحدي الأساسي جودة المحتوى وعمقه توجيه جوجل للصفحات المهمة من غير ما تضيّع الميزانية
أهمية Crawl Budget متوسطة عالية جداً خصوصاً لو الموقع عنده آلاف المنتجات
الـ Sitemap ثابت كافي ديناميكي لازم يتحدث أوتوماتيك مع كل تغيير
robots.txt بسيط لازم يمنع أرشفة صفحات الفلترة والتاجات والـ cart
Canonical نادراً مشكلة ضروري جداً لصفحات المنتجات المتشابهة
Internal Linking بين المقالات ذات الصلة من صفحات الفئات للمنتجات لتوزيع الـ Crawl Budget

أخطاء شائعة بتأخر الأرشفة

  • حجب صفحات مهمة في robots.txt من غير قصد: بيحصل لما المطور بيمنع كل الموقع وقت التطوير وبينسى يرفع الحجب عند النشر. الحل: اتأكد دايماً من الـ robots.txt بعد كل نشر جديد.
  • الانتظار من غير ما تبعت الصفحة يدوياً: جوجل ممكن تاخد أسابيع تكتشف الصفحة لوحدها. “فحص عنوان URL” في Search Console بيقصّر ده لأيام أو ساعات.
  • نشر صفحات ضعيفة بكميات كبيرة: كل صفحة ضعيفة بتضيّع جزء من الـ Crawl Budget. 10 صفحات عميقة أفضل من 100 صفحة ضعيفة.
  • تجاهل أخطاء الزحف في Search Console: صفحات الـ 404 والـ Redirect المكسورة بتاكل الـ Crawl Budget وبتبطّئ أرشفة باقي الموقع. راجعها كل شهر على الأقل.
  • محتوى متكرر من غير Canonical: لو عندك صفحات متشابهة من غير canonical واضح جوجل بتتحير إيه الصفحة الأصلية وممكن تتأخر في أرشفة الاتنين.
  • عدم تحديث المحتوى القديم: الصفحات اللي مش بتتحدث بتنزل في أولوية الزحف مع الوقت. مقال قديم بمعلومات محدّثة وابعاته من Search Console بيرجع على رادار جوجل بسرعة.

بعد الأرشفة الخطوات الجاية

الأرشفة هي البداية مش النهاية. كتير من الناس بتفرح لما صفحتها تتأرشف وبتوقف هنا وده بالظبط اللي بيخلي الصفحة تتأرشف لكن ماتظهرش في أول النتائج.

المرحلة المعنى اللي بيحدده
الأرشفة جوجل حافظة صفحتك في الـ Index جودة المحتوى + إشارات تقنية صح
الظهور الصفحة بتظهر في نتائج البحث الأرشفة + مطابقة كلمة البحث
الترتيب الصفحة في أول النتائج الجودة + Backlinks + سلطة الموقع + تجربة المستخدم
  • راقب Search Console بعد أسبوعين: شوف على أنهي كلمات بدأت تظهر دي الكلمات اللي جوجل بتربط صفحتك بيها فعلاً.
  • حسّن الـ CTR: لو الصفحة ظاهرة لكن محدش بيضغط عليها العنوان والـ meta description محتاجين تحسين.
  • ابني Backlinks للصفحة: الأرشفة من غير Backlinks بتخلي الصفحة في صفحة 3-4. كل Backlink من موقع موثوق بيدفعها للأمام.
  • تابع المنافسين: شوف مين بيتصدر نفس الكلمة وإيه اللي صفحته بتقدمه أكتر من صفحتك.
  • حدّث المحتوى بانتظام: الصفحة المتأرشفة لكن المحتوى فيها قديم بتنزل في الترتيب مع الوقت.

لو عايز تعرف أكتر عن إزاي تحسّن ترتيب صفحاتك بعد الأرشفة، اقرأ مقالنا عن تحسين محركات البحث.

إزاي تتحقق إن صفحاتك اتأرشفت أدوات مجانية

Google Search Console الأداة الأهم

  • اكتب site:yourdomain.com في جوجل وشوف كام صفحة ظاهرة
  • ادخل على “الفهرسة” في Search Console وشوف الصفحات المتأرشفة والمستبعدة وأسباب الاستبعاد
  • استخدم “فحص عنوان URL” لأي صفحة عايز تتأكد من حالتها بالتفصيل

Google PageSpeed Insights للسرعة

سرعة الموقع بتأثر مباشرة على الـ Crawl Budget. افتح PageSpeed Insights وافحص موقعك على الموبايل لو أقل من 50 في أي معيار، في مشكلة بتأثر على أرشفتك.

Screaming Frog للتدقيق التقني الكامل

النسخة المجانية بتفحص أول 500 صفحة. بيكشف صفحات الـ noindex، الـ canonical الغلط، الـ redirect المكسورة، وصفحات الـ 404 كل الأسباب الخفية في خطوة واحدة.

أسئلة بتتكرر كتير عن أرشفة المواقع

كام وقت بياخد أرشفة صفحة جديدة؟

موقع جديد من غير سلطة: من أسبوع لشهر. موقع موجود وعنده سلطة كويسة: من ساعات لأيام. لو بعتها يدوياً من Search Console: من ساعات لأيام في الغالب. الوقت بيعتمد على قوة موقعك وحجم الـ Crawl Budget المخصص ليه.

هل الـ Sitemap بيضمن الأرشفة؟

لأ الـ Sitemap بيسهّل على جوجل إنها تلاقي صفحاتك، لكن مش بيضمن إنها هتأرشفهم. جوجل لازم تقرر إن الصفحة تستاهل الأرشفة. لو المحتوى ضعيف الـ Sitemap مش هيحل المشكلة.

إيه معنى Discovered but not indexed في Search Console؟

يعني جوجل شافت الصفحة لكن قررت إنها مش هتأرشفها دلوقتي. الأسباب: محتوى ضعيف، ضغط على الـ Crawl Budget، أو أولويات تانية عند جوجل. الحل: حسّن المحتوى وابعت الصفحة يدوياً من Search Console.

هل سرعة الموقع بتأثر فعلاً على الأرشفة؟

أيوه وبشكل مباشر. الموقع البطيء بياخد وقت أكتر من الـ Crawl Budget في كل صفحة يعني جوجل بتزحف على صفحات أقل في نفس الوقت. موقع بيحمّل في ثانية واحدة بدل 4 ثواني ممكن يضاعف عدد الصفحات اللي جوجل بتزحف عليها يومياً.

هل نشر المحتوى على السوشيال ميديا بيساعد في الأرشفة؟

بشكل غير مباشر أيوه. لما الناس بتشارك اللينك، بيجيب زيارات للصفحة، وده بيساعد جوجل تكتشفها أسرع. مش حل أساسي لكنه بيساعد خصوصاً للمواقع الجديدة.

هل تحديث المحتوى القديم بيساعد في الأرشفة؟

أيوه جوجل بتزحف على المحتوى المحدث أسرع من المحتوى الساكن. تحديث مقال قديم بمعلومات جديدة وإرساله من Search Console بيخلي جوجل تزوره أسرع وبيحسّن ترتيبه في نفس الوقت.

هل ممكن صفحة تتأرشف وبعدين تتشال من الأرشفة؟

أيوه وده بيحصل لو جوجل قررت إن المحتوى اتضعّف أو بقى مكرر أو في تاج noindex اتضاف. الصفحة ممكن تختفي من نتائج جوجل من غير ما تعمل حاجة ولو ملقتش تفسير، راجع أي تحديث حصل على الصفحة في Search Console.

الأرشفة مش “ارفع Sitemap وانتظر.” دي عملية محتاجة تفهمها عشان تقدر تتحكم فيها وكل مشكلة فيها ليها حل مختلف.

الموقع اللي بيفهم إزاي جوجل بتزحف وبتقرر إيه الصفحة تستاهل الأرشفة ده الموقع اللي صفحاته بتظهر أسرع وبتفضل ظاهرة لفترات أطول.

خطوة واحدة دلوقتي: افتح Google Search Console وشوف قسم “الفهرسة” لو عندك صفحات في “Discovered but not indexed” أو “Crawled but not indexed” دي الصفحات اللي محتاج تبدأ بيها فوراً.

ولو محتاج مساعدة في تشخيص مشاكل أرشفة موقعك تواصل مع فريق Brandit وهنساعدك تحدد المشكلة وتحلها بسرعة.

Abdullah

احدث المقالات

تواصل معنا