Resultat 1 till 5 av 5

Lite frågor om robots.txt

  1. #1
    jakobias avatar
    jakobia jakobia är inte uppkopplad Lär mig SEO
    Reg.datum
    dec 2011
    Ort
    Helsingborg
    Inlägg
    118
    Har flera url'er som spindlas liknande denna:

    https://www.hemligurlsomintegårnågon...-42-c-119.aspx

    Sedan har jag ett paginationproblem när det skapas fler sidor, liknande detta:


    http://www.hemligurlsomintegårnågons...=1&useparams=0

    Tänkte göra detta som jag hittade på nätet som jag har citerat nedan:

    för http

    Disallow: /?sortorder=*&

    och för https

    Disallow: /FastLogin

    Är detta ett korrekt sätt att göra det på? För att blockera dessa url'er?
    Och hur konfigurerar man det på servern? Att den använder olika robots.txt för de olika protokollen.
    Det är en e-butik som använder Jetshop.

    Guru

    Oct 8, 2011
    Sha Menz
    Project Manager, Inbound Marketing at BF Design Studio

    Hi Rick,

    If you wish to use the robots.txt method to disallow all or part of your site's https protocol, you simply need to load two separate robots.txt files.

    The http and https protocols are basically viewed by bots as if they were two completely separate root domains (which I guess you already know as you have mentioned the fact that port 443 is used for the secure protocol).

    Google's advice is that to use this method, you should have a separate robots.txt file for each protocol with code as follows:

    For your http protocol (http://www.startuploans.org/robots.txt):

    User-agent: *
    Allow: /

    For the https protocol (https://www.startuploans.org/robots.txt):

    User-agent: *
    Disallow: /

    However, blocking crawlers with robots.txt is not the most reliable method for excluding pages from Search engines. The reason for this is that the page will continue to be indexed if it happens to be found via a link from another page. Basically, the robots.txt is the sign on the front door that says "Please stay out of our house", but it is never seen by the people who enter via the rear exit or climb in a window!

    The most reliable method of excluding pages is to add the noindex meta tag as suggested by MagentoWebDeveloper and Alan.When a bot encounters the noindex meta tag it will send a signal to the search engine to de-index the page and there is no further problem.

    I would generally use noindex, follow rather than noindex, nofollow as the nofollow tag will stop the flow of link value through your site. In most cases, as long as the noindex is in place, there is no reason to be worried about the links on the pages being followed.

    You should NEVER use both methods at the same time.

  2. #2
    Niklas Aronssons avatar
    Niklas Aronsson Niklas Aronsson är inte uppkopplad SEO-proffs
    Moderator för alla forumsektioner
    Reg.datum
    nov 2009
    Ort
    Malmö
    Inlägg
    753
    Någon som har ett svar på detta?

  3. #3
    Tobias Nyholms avatar
    Tobias Nyholm Tobias Nyholm är inte uppkopplad Moderator
    Reg.datum
    maj 2009
    Ort
    Stockholm
    Inlägg
    881
    Jag skulle inte säga att robots.txt är rätt sätt att hantera detta problem. Jag skulle implementera canonical-taggen för att visa google att detta är /fastLogin.aspx eller /category-listning.aspx?term=cats

    Anledningen är att du vill säga till google att "dessa sidor visar samma innehåll, det är bara en permutation".
    CTO på Happyr.com. Vi gör rekrytering effektivt

  4. #4
    MOBs avatar
    MOB MOB är inte uppkopplad Kan SEO rätt bra
    Reg.datum
    sep 2011
    Ort
    Malmö
    Inlägg
    347
    Pain-in-the-b*tt
    Håller med Tobias att robots inte är rätt väg, jag hade dock försökt kontakta Jetshop eller de som satte upp den.
    Mycket möjligt de redan har en lösning / uppdatering på det här problemet.

  5. #5
    jakobias avatar
    jakobia jakobia är inte uppkopplad Lär mig SEO
    Reg.datum
    dec 2011
    Ort
    Helsingborg
    Inlägg
    118
    Citat Ursprungligen postat av Tobias Nyholm Visa inlägg
    Jag skulle inte säga att robots.txt är rätt sätt att hantera detta problem. Jag skulle implementera canonical-taggen för att visa google att detta är /fastLogin.aspx eller /category-listning.aspx?term=cats

    Anledningen är att du vill säga till google att "dessa sidor visar samma innehåll, det är bara en permutation".
    Jo saken är den att vi redan har föreslagit detta för Jetshop, så de kommer nog att justera detta vid nästa uppdatering som de inte vet när den blir av. Dock har jag möjlighet att redan nu använda mig av robots.txt men jag kanske ska lugna mig och vänta på nästa uppdatering så kommer detta problem att lösa sig med tiden. Dumt att göra en "dålig" lösning som ligger och skräpar i systemet.

Ämnesinformation

Användare som tittar på det här ämnet

Det är för närvarande 1 användare som tittar på det här ämnet. (0 medlemmar och 1 gäster)

Liknande ämnen

  1. Har gett mig in i affiliateträsket, lite frågor
    Av Kimpo i forum Affiliate / AdSense
    Svar: 6
    Senaste inlägg: 2012-03-19, 22:58
  2. Lite frågor vid val av domännamn
    Av xtreme i forum Optimering
    Svar: 4
    Senaste inlägg: 2011-08-18, 22:53
  3. lite frågor angående SEM
    Av canegy i forum Google AdWords
    Svar: 10
    Senaste inlägg: 2010-10-15, 09:23
  4. Lite newbie-frågor om SEO..
    Av thegoogoodoll i forum Optimering
    Svar: 9
    Senaste inlägg: 2008-04-11, 16:08
  5. Lite snabba frågor!
    Av Henrik i forum Optimering
    Svar: 1
    Senaste inlägg: 2008-01-08, 10:15