Dewaweb | Cara Setting Keamanan Robots.txt – Keamanan website menjadi prioritas utama bagi pemilik bisnis online, blogger, hingga pengembang aplikasi web.
Bayangkan jika file konfigurasi sensitif seperti wp-config.php atau direktori admin terekspos secara publik di hasil pencarian Google, dan hal ini bisa membuka pintu bagi serangan hacker, pencurian data, atau penyalahgunaan informasi rahasia perusahaan Anda.
File robots.txt muncul sebagai solusi sederhana namun powerful untuk mengontrol akses bot pencari web, mencegah crawling pada area sensitif tanpa mengganggu indeksasi konten utama situs.
Robots.txt bukanlah firewall mutlak, tapi instruksi protokol standar yang diikuti oleh Googlebot, Bingbot, dan crawler terkemuka lainnya sejak diperkenalkan pada 1994 oleh Jack Kroupa dan Martijn Koster.
Menurut panduan resmi Google, file ini terutama berguna untuk mengelola crawl budget yang dimana jumlah halaman yang dirayapi per sesi, sehingga server tidak overload, sekaligus melindungi aset digital dari paparan tidak perlu. Namun, kesalahan umum seperti memblokir seluruh situs atau salah sintaks bisa berakibat fatal seperti webstie hilang dari SERP / pencarian atau justru mengekspos struktur direktori internal.
Untuk pengguna WordPress, pengaturan ini semakin krusial karena infrastruktur mereka mendukung akses mudah via cPanel File Manager, maka tidak heran banyak injection script, pencurian file penting dan lainnya yang bisa di-akses.
Dewaweb sebagai perusahaan Web Hosting Terbaik Indonesia sejak 2014 yang menyediakan layanan Cloud Hosting Indonesia dan juga layanan Beli Domain Murah yang telah dipercaya ribuan pengguna, maka dalam artikel ini akan membahas tentang Panduan Cara Setting Keamanan Robots.txt, mulai dari dasar sintaks, identifikasi file sensitif, langkah setting di berbagai platform agar website Anda tetap privat, cepat, dan ranking tinggi.
Apa Itu Robots.txt dan Fungsinya untuk Keamanan
Apa Itu Robots.txt? – Robots.txt adalah file teks plain (UTF-8) yang ditempatkan di root domain (contoh: domain.com/robots.txt) untuk memberi instruksi kepada web crawler.
Fungsi utama Robots.txt adalah mengatur mana yang boleh dan tidak boleh dirayapi, sehingga bot fokus pada konten bernilai tinggi seperti halaman produk atau blog post.
Dalam konteks keamanan, robots.txt mencegah eksposur file sensitif yang meski tidak bisa dicegah sepenuhnya dari akses langsung, tapi menghindari kemunculan di indeks pencarian, sehingga mengurangi risiko reconnaissance oleh attacker.
Google menekankan: jangan gunakan untuk data rahasia, tetapi kombinasikan dengan .htaccess atau autentikasi.
Keuntungan lain: optimalisasi crawl budget untuk situs besar, menghemat resource server hingga 30-50% pada high-traffic site (website yang memiliki kunjungan atau trafik tinggi).
Namun, batasannya jelas bahwa crawler jahat seperti scraper bisa mengabaikannya, dan halaman terindeks sebelumnya tetap muncul di cache. Di Dewaweb, ini sinergis dengan WAF Imunify360 untuk lapisan perlindungan berlapis.
File Sensitif yang Harus Diblokir di Robots.txt
Identifikasi file sensitif krusial sebelum setting.
Di WordPress, prioritas utama: wp-config.php (database credentials), /wp-admin/ (panel login), /wp-includes/, /wp-content/uploads/ (draft/private files). Blokir juga .env, backup.zip, invoices.pdf, atau /cgi-bin/.
- wp-config.php: Ekspos password DB berisiko SQL injection.
- /wp-admin/: Hindari indeks login page yang bisa dieksploitasi brute force.
- /xmlrpc.php: Rentan DDoS; blokir kecuali diperlukan.
- File log/error: Ungkap vulnerability server.
Untuk non-WordPress: block /admin/, /private/, *.bak, *.sql. Jangan blokir CSS/JS utama agar rendering halaman normal. Di e-commerce, tambah /checkout/ atau /cart/ untuk privasi user.
Sintaks Dasar dan Lanjutan Robots.txt
Sintaks sederhana: User-agent (target bot), Disallow (blokir path), Allow (izinkan exception), Sitemap (arah peta situs).
Contoh dasar aman untuk setting Robots.txt pada WordPress:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /wp-config.php
Disallow: /*.sql$
Sitemap: https://domain.com/sitemap.xml
Ini blokir admin kecuali AJAX, file SQL, dan arahkan sitemap.
Lanjutan untuk SEO:
- User-agent: Googlebot (khusus Google).
- Crawl-delay: 10 (batasi kecepatan bot).
- $ (akhiri file spesifik): Disallow: /secret.html$
- Wildcard: Disallow: /user/*/private/ (block subpath).
Untuk bot AI seperti GPTBot: Disallow: /semua/ jika khawatir scraping. Validasi UTF-8 tanpa BOM.
Cara Setting Robots.txt di WordPress Manual
- Buat file robots.txt di Notepad, tulis kode seperti contoh.
- Akses cPanel Dewaweb > File Manager > public_html > Upload ke root.
- Set permission 644 (rw-r–r–).
- Verifikasi: kunjungi domain.com/robots.txt (harus 200 OK).
Hindari edit via FTP jika hosting punya virtual robots.txt (cek dulu). Backup dulu!.
Setting Keamanan Robots.txt Dengan Plugin SEO
Plugin memudahkan non-tech user atau yang tidak memahami hal teknis, bisa menggunakan plugin dan settingan dibawah ini:
Yoast SEO:
- Install > SEO > Tools > File Editor > Edit robots.txt.
- Tambah rules > Save.
Rank Math:
- Rank Math > General Settings > Edit Robots.txt > Input kode > Update.
All in One SEO:
- AIOSEO > Feature Manager > Aktifkan robots.txt > Edit rules.
Keunggulan: Auto-generate, integrasi sitemap, preview. Cocok untuk WordPress yang menggunakan Cloud Hosting Dewaweb dengan unlimited DB.
Pengujian dan Validasi Robots.txt
Gunakan Google Search Console > Robots.txt Tester: Paste kode, test URL spesifik.
Tools lain: Screaming Frog, Ahrefs Site Audit.
Cek penting:
- Syntax error (no comma, lowercase).
- Blokir halaman penting? (robots.txt tester simulasikan).
- Aksesibel publik?
Monitor GSC Crawl Stats pasca-update.
Kesalahan Umum dan Cara Hindari
- Blokir / seluruh situs: Tambah Allow: / setelah Disallow: /.
- Ekspos direktori: Jangan comment # /private/ (muncul di robots.txt).
- Lupa sitemap: Selalu sertakan.
- Case-sensitive salah: Gunakan lowercase path.
- Noindex vs disallow: Disallow cegah crawl, noindex cegah indeks.
Update rutin tiap quarter atau post-major changes.
Integrasi Robots.txt dengan Keamanan Hosting Dewaweb
Dewaweb Cloud Hosting unggul dengan NVMe storage, AMD EPYC, dan Ninja Support 24/7 sangat ideal untuk robots.txt implementation. Kombinasikan:
- .htaccess: Require auth pada wp-config.php.
- SSL A+ gratis + Imunify360 block malware.
- Backup harian restore jika error.
Upgrade Paket Warrior Dewaweb untuk dapatkan unlimited addon domain, cocok multi-site aman.
Optimasi SEO Dengan Robots.txt 2026
Di tahun 2026, ada cara optimasi SEO dengan Robots.txt yang bisa Anda coba:
Blokir low-value: /search/, /?filter=, paginasi infinite (hemat crawl budget 20-40%).
Prioritaskan core pages untuk ranking lebih baik di Helpful Content Update. Tambah Sitemap: tingkatkan discovery 15%.
Cara Setting Keamanan Robots.txt WordPress
Kesimpulan: Cara Setting Keamanan Robots.txt WordPress.

Menerapkan keamanan robots.txt bukan sekadar teknis, tapi strategi holistik untuk lindungi aset digital sambil boost performa SEO jangka panjang.
Dari identifikasi wp-config.php hingga pengujian di GSC, setiap langkah di atas dirancang agar situs Anda anti-eksposur, efisien crawl, dan compliant dengan standar Google 2026 yang menekankan zero-trust security dan AI-driven crawling.
Ingat, robots.txt paling efektif di hosting reliable seperti Dewaweb yang sertifikasi ISO 27001, 100% uptime SLA, dan fitur premium Anti-DDoS, sehingga mencegah tidak hanya bot baik tapi juga ancaman nyata.
Jangan tunggu breach terjadi, melainkan implementasikan hari ini agar file penting Anda aman.
Saran terbaik & Privilege: jika Anda butuh hosting yang mendukung keamanan tinggi, maka Anda bisa coba menggunakan Cloud Hosting NVME Dewaweb, yang dilengkap Privilege Konsumen dengan Ninja Support 24/7 Dewaweb.

