# robots.txt für [DOMAIN]
# gesamte Site mit HTML-Seiten freigegeben
User-agent: *
Disallow: /track.php
Disallow: /print.php$
Disallow: /*print.php
Disallow: /awstats/
Disallow: /closed/
Disallow: /export_track/
Disallow: /layout/
# Google Adsense zulassen
User-agent: Mediapartners-Google*
Disallow:
# Crawler die robots.txt beachten, die wir lieber nicht
# sehen wollen, es sei denn sie bedienen Suchmaschinen.
#
User-agent: UbiCrawler
Disallow: /
User-agent: DOC
Disallow: /
User-agent: Zao
Disallow: /
# Einige Bots sind als Plage bekannt, speziell die, die
# ganze Seiten kopieren - bitte dieses Verbot beachten.
#
User-agent: sitecheck.internetseer.com
Disallow: /
User-agent: Zealbot
Disallow: /
User-agent: MSIECrawler
Disallow: /
User-agent: SiteSnagger
Disallow: /
User-agent: WebStripper
Disallow: /
User-agent: WebCopier
Disallow: /
User-agent: Fetch
Disallow: /
User-agent: Offline Explorer
Disallow: /
User-agent: Teleport
Disallow: /
User-agent: TeleportPro
Disallow: /
User-agent: WebZIP
Disallow: /
User-agent: linko
Disallow: /
User-agent: HTTrack
Disallow: /
User-agent: Microsoft.URL.Control
Disallow: /
User-agent: Xenu
Disallow: /
User-agent: larbin
Disallow: /
User-agent: libwww
Disallow: /
User-agent: ZyBORG
Disallow: /
User-agent: Download Ninja
Disallow: /
User-agent: grub-client
Disallow: /
User-agent: k2spider
Disallow: /
User-agent: NPBot
Disallow: /
User-agent: WebReaper
Disallow: /