PDA

Bekijk Volledige Versie : Netwerk valt gedeeltelijk weg



ErikKosters
12/08/06, 19:42
Beste WHT-ers,

Ik heb hier reeds al eens topic over gemaakt echter is dat toen teniet gedaan. Echter heb ik nu wat meer informatie dat jullie misschien op een spoor doet lijden, ik kom er in ieder geval niet uit.

Ik heb een server met de volgende configuratie:

AMD Sempron64 2800+
1.5GB DDR400/PC3200 Geheugen
80GB Hardeschijf (Western Digital)
2e Netwerk-kaart (Sweex)

En mijn netwerk instellingen staan als volgt:



DEVICE=eth0
ONBOOT=yes
BOOTPROTO=static
IPADDR=195.238.xx.xx
NETMASK=255.255.255.0
GATEWAY=195.238.xx.xx

Aangesloten op een HP ProCurve 2626 (productie netwerk)




DEVICE=eth1
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.xx.xx
NETMASK=255.255.255.0
GATEWAY=

Aangesloten op een HP ProCurve 2124 (backup netwerk)


Het werkt enkel en alleen niet op 1 server, de andere servers hebben precies dezelfde instelling (tevens dezelfde hardware) en hierop werkt het prima. Daarom vraag ik of jullie misschien weten waar ik naar moet kijken.

Jesperw
12/08/06, 19:48
Het zou bijvoorbeeld een IRQ conflict kunnen zijn. Sommige moederborden willen daarmee wel eens moeilijk doen (Had ik ook eens met een oude zelfbouw bak).

Tik maak eens dmesg, en kijk of daar informatie in staat. Meestal wel. :)

ErikKosters
12/08/06, 19:52
Dit is mijn output:



ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (8192 buckets, 65536 max) - 356 bytes per conntrack
parport0: PC-style at 0x378 [PCSPP,TRISTATE]
lp0: using parport0 (polling).
lp0: console ready
NET: Registered protocol family 10
Disabled Privacy Extensions on device c0378f60(lo)
IPv6 over IPv4 tunneling driver
divert: not allocating divert_blk for non-ethernet device sit0
eth0: no IPv6 routers present
via-rhine: Reset not complete yet. Trying harder.
eth0: link up, 100Mbps, full-duplex, lpa 0x41E1
eth0: no IPv6 routers present
eth0: link up, 100Mbps, full-duplex, lpa 0x41E1
eth1: link up, 100Mbps, full-duplex, lpa 0x45E1
eth0: no IPv6 routers present
eth1: no IPv6 routers present


Lijkt mij dat hij naar IPv6 ip-addressen ofzo zoekt.. Maar we zitten op IPv4 netwerk.. Het rare vindt ik dat hij niet te bereiken is via het 195.238.xx.xx ip vanaf buiten af echter wel vanuit een andere server in hetzelfde netwerk maar ook weer via het ip 195.238.xx.xx

Jesperw
12/08/06, 20:04
Dat over V6 maakt niet uit, dat komt omdat je V6 kernel support hebt.

Als dat ip vanaf buiten niet bereikbaar is maar lokaal op dat 195 ip wel, dan is:

- Je gateway niet ingesteld (of fout)
- Je router zich nog niet bewust van een eventuele mac-adres change. Arp cache. Wat kan helpen is:

Commando: ip neigh flush all
Commando: ping -I 195.238.*.* ip.van.je.gateway

Dan pingt 'ie je router met dat ip, waardoor je router het licht zou kunnen gaan zien.

Maar het meest voor de hand liggende is je gateway. :)

ErikKosters
12/08/06, 20:12
Gateway kan het niet aan liggen aangezien deze voor elke server hetzelfde is (zelfde ip-range). Ik snap daarom ook niet hoe het komt. Het is gewoon als ik de netwerk service herstart hij blijft hangen, dan moet ik via andere server erheen connecten en nogmaals netwerk service herstarten dan werkt het weer prima (behalve het 2e netwerk adapter dan deze kan niet connecten naar het backupnetwerk).

Jurian
12/08/06, 20:25
Hang 'm eens aan een andere poort op de switch? Weet je in ieder geval zeker dat die poort niet het probleem oplevert.

Bekijk ook eens de output van "route" in de normale situatie en vergelijk die met als 't netwerk weer vreemd doet, kijk vooral of de default gateway niet veranderd of verdwenen is. Probeer dan ook de gateway eens te pingen vanaf die server, lukt dat nog wel?

ErikKosters
12/08/06, 20:28
Heb het net ff geprobeerd (dus ff service network restart) en ja hoor gebeurde precies zelfde. De gateway is gewoon te pingen in die tijd, echter moet ik dus via andere server connecten erheen.

systemdeveloper
12/08/06, 21:34
al eens een andere netwerkkaart erin gestopt? Het zal niet de eerste keer zijn dat een netwerkkaartje 'half' kapot is.

WilloW
12/08/06, 21:50
al eens een andere netwerkkaart erin gestopt? Het zal niet de eerste keer zijn dat een netwerkkaartje 'half' kapot is.


en vooral die prijsklasse kaartjes... toch veel mooier om er een mooie 3com erin te stoppen? belast veel minder de processor en zo'n amd sempron heeft het al zo moelijk af en toe

systemdeveloper
12/08/06, 22:12
of een intelletje. Goeie ervaringen mee.

ErikKosters
12/08/06, 23:15
Heb al eens het kaartje gewijzigd. Echter vindt ik het raar dat het alleen op die server voorkomt, ook naar netwerkkaart wijziging. Verder heb ik ook al geprobeerd op een andere poort te gooien, dit mocht niets baten.

crazycoder
12/08/06, 23:23
Vaag. Als niets helpt kan je (zoals een eerdere suggestie) eventueel je coloboer vragen om een andere poort op de switch.

O ja, maar je heb dit probleem natuurlijk al met je coloboer besproken.. toch??

ErikKosters
13/08/06, 01:09
Coloboer... Heb een eigen switches en eigen rack :) En heb dit zelf al geprobeerd zonder resultaat.

Technotop
13/08/06, 09:31
of een intelletje. Goeie ervaringen mee.

Intel Pro 1000 MT +)

Tip aan de topic starter, gooi één netwerkinterface eens down. Dan zal hij het als het goed is weer moeten doen. Heb hier op de nieuwe kernels van linux ook nog wel eens problemen.

crazycoder
13/08/06, 09:45
Coloboer... Heb een eigen switches en eigen rack :) En heb dit zelf al geprobeerd zonder resultaat.
Dan moet je misschien iemand erbij halen die er meer vanaf weet..... via een forum troubleshooten is lastig...

ErikKosters
13/08/06, 09:49
Het blijkt dus toch wel degelijk aan de 2e netwerk-kaart te liggen aangezien als ik dus eth1 uitschakel bij het opstarten hij gewoon doorloopt zonder problemen. Ik zal wel een nieuw netwerkkaartje halen en dan even opnieuw testen :).

systemdeveloper
13/08/06, 10:19
i knew it :)

Ook al eens gehad.. uren gezocht. Ik verander nu eerst altijd de kaart voordat ik zwaar aan de software ge knutselen .

ErikKosters
13/08/06, 10:34
Welke kaart bevelen jullie aan? Het gaat hier om een 100Mbit backup-netwerk dus, middels HP ProCurve 2124.

systemdeveloper
13/08/06, 10:39
Ik heb tot nog toe weinig problemen met de Intel Pro kaarten.

Proxio
13/08/06, 10:39
Intel of 3COM, maakt verder weinig uit :). Iets in die richting.

@Erik: Ik heb er nog stuk of 15 liggen overigens in Easynet, kan je wel een hebben anders.

ErikKosters
13/08/06, 10:55
Trouwens vindt ik het nog een raar probleem hoor, aangezien als ik via server2 inlog op server1 (de boosdoener :p) en dan 'service network restart' doe ik via SSH nog kan bereiken (vanaf server2 dus he, niet thuis!) en voor buitenwereld is hij onbereikbaar. Doe ik dan nogmaals 'service network restart' dan is hij weer voor iedereen bereikbaar. Het lijkt toch alsof hij de route niet goed pakt om 1 of andere manier.

Ik doe dit bovenstaande dus met eth1 uit!


Edit: Smilie + Typo.

Technotop
13/08/06, 11:04
Welke kaart bevelen jullie aan? Het gaat hier om een 100Mbit backup-netwerk dus, middels HP ProCurve 2124.

Het heeft niets met de kaart te maken, meer met dat Linux niet weet waar hij het verkeer over moet gaan gooien. Oudere kernels lopen hier als een trein met twee netwerkkaarten naar het internet.

Echter de nieuwe kernels werken gewoon niet mee, zeer vervelend. Wij werken met een internetwerk en een intranetwerk, echter hebben wij bij redelijk wat cliënten problemen met de tweede netwerkkaart/interface.

Gewoon één uitschakelen. Nieuwe netwerkkaart heeft geen zin.

(CentOS 4,3 doet af en toe erg vreemd)

ErikKosters
13/08/06, 11:06
Gewoon 1 uitschakelen, hebben we toch al gedaan? Dit mocht niets baten, momenteel draait alleen eth0 maar waarnschijnlijk toch iets van een Corrupt? dmesg geeft mij geen nuttige info.

Maar hoe fix ik dit aangezien wij backupnetwerk wel nodig zijn. En 1 uitschakelen geen optie is.

Technotop
13/08/06, 11:11
Gewoon 1 uitschakelen, hebben we toch al gedaan? Dit mocht niets baten, momenteel draait alleen eth0 maar waarnschijnlijk toch iets van een Corrupt? dmesg geeft mij geen nuttige info.

Maar hoe fix ik dit aangezien wij backupnetwerk wel nodig zijn. En 1 uitschakelen geen optie is.

Optie nog niet gevonden, kan wel eens navragen bij een paar clënten. Die hadden het zelfde probleem en hebben dit als het goed is ook weten op te lossen.

almar
13/08/06, 12:08
Misschien een defect PCI slot? Dit komt niet vaak voor maar ik heb het 1 keer meegemaakt.

gjtje
13/08/06, 12:28
CentOS != linux. Het feit dat Centos ergens een probleem mee heeft wil nog niet betekenen dat dit aan linux ligt.

Zou natuurlijk kunnen zijn dat eth0 traag is met initialiseren waardoor op het moment dat het script de route toevoegt dit mislukt omdat het netwerk nog unreachable is. Misschien dat in het init script een delay is in te bouwen.

Dat je er vanaf de andere server wel bijkan is omdat deze in hetzelfde subnet zit en de gateway dus niet gebruikt wordt.

ErikKosters
13/08/06, 19:59
Een defect pci slot is het niet (zoals aangegeven is de hardware reeds gewijzigd) kan het zijn dat het aan de pci riser komt? En verder lijkt mij het inderdaad gjtje dat ik via andere server erop kan doordat hij geen gateway nodig is.

Ik zou het zo niet weten.

@Robbert: Als je wilt vraag het ze even, zou dit probleem graag opgelost zien.

It-Biz
13/08/06, 20:21
Wellicht 2 dezelfde merk en type nic's gebruiken, is 1 van de 2 een onboard?

ErikKosters
13/08/06, 20:26
ja 1 v/d 2 is onboard gewoon. Echter zoals ik reeds heb gezegd, is het moederbord reeds vervangen.

Alles is verder het zelfde.

gjtje
13/08/06, 22:37
Maar het heeft niks met die 2e netwerkkaart te maken aangzien je eerder al zei dat het met nr2 disabled ook niet werkte.

ErikKosters
13/08/06, 23:16
Ik denk daarom ook dat het misschien een kernel kwestie is... Echter hoe kom ik hier achter?

Jurian
14/08/06, 14:54
Nieuwe kernel compilen :-)

Wat misschien nog het probleem zou kunnen zijn, is dat ECN (Explicit Congestion Notification) aan staat, dit systeem is in theorie heel handig, maar in de praktijk heb ik het nog nooit goed zien werken, met allerlei vreemde gevolgen (zoals netwerk verbindingen die opeens niet meer werken). Dit staat echter standaard niet aan dus het lijkt me niet dat dit het probleem is.

Ik zou een nieuwe kernel bakken zodat je zeker weet dat alleen de goede drivers er in zitten.

Is 't trouwens de on-board kaart die vreemd doet, of de losse kaart? En wat voor soort kaarten zijn dit precies? (zie output "lspci"), misschien zijn er wat problemen bekend met bepaalde versies van deze kaarten.

ErikKosters
14/08/06, 15:18
Hier met lspci output:



[root@www01 ~]# lspci
00:00.0 Host bridge: VIA Technologies, Inc. K8M800 Host Bridge
00:00.1 Host bridge: VIA Technologies, Inc. K8M800 Host Bridge
00:00.2 Host bridge: VIA Technologies, Inc. K8M800 Host Bridge
00:00.3 Host bridge: VIA Technologies, Inc. K8M800 Host Bridge
00:00.4 Host bridge: VIA Technologies, Inc. K8M800 Host Bridge
00:00.7 Host bridge: VIA Technologies, Inc. K8M800 Host Bridge
00:01.0 PCI bridge: VIA Technologies, Inc. VT8237 PCI bridge [K8T800/K8T890 South]
00:0b.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL-8139/8139C/8139C+ (r ev 10)
00:0f.0 RAID bus controller: VIA Technologies, Inc. VIA VT6420 SATA RAID Controller ( rev 80)
00:0f.1 IDE interface: VIA Technologies, Inc. VT82C586A/B/VT82C686/A/B/VT823x/A/C PIP C Bus Master IDE (rev 06)
00:10.0 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.1 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.2 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.3 USB Controller: VIA Technologies, Inc. VT82xxxxx UHCI USB 1.1 Controller (rev 81)
00:10.4 USB Controller: VIA Technologies, Inc. USB 2.0 (rev 86)
00:11.0 ISA bridge: VIA Technologies, Inc. VT8237 ISA bridge [KT600/K8T800/K8T890 Sou th]
00:11.5 Multimedia audio controller: VIA Technologies, Inc. VT8233/A/8235/8237 AC97 A udio Controller (rev 60)
00:12.0 Ethernet controller: VIA Technologies, Inc. VT6102 [Rhine-II] (rev 78)
00:18.0 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] HyperTranspor t Technology Configuration
00:18.1 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] Address Map
00:18.2 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] DRAM Controll er
00:18.3 Host bridge: Advanced Micro Devices [AMD] K8 [Athlon64/Opteron] Miscellaneous Control
01:00.0 VGA compatible controller: VIA Technologies, Inc. S3 Unichrome Pro VGA Adapte r (rev 01)


Weet niet of het onboard is of de aparte kaart aangezien als ik hem uitschakel gewoon hetzelfde blijft weergeven. Ik denk toch aan een andere kernel of iets dergelijks aangezien ik reeds andere mobo heb gedaan en het nog is.

Jurian
14/08/06, 16:01
Hmm, realtek en VIA rhine-II, allebei nou niet kaartjes waar je heel vrolijk van wordt, ze werken wel, maar geven de vreemdste problemen als ze 't wat drukker krijgen. Realtek is leuk voor in een desktop, maar IMHO niet geschikt voor server werk. De VIA chipsets heb ik niet heel veel ervaring mee, maar de ervaring DIE ik er mee heb, was niet goed ;p . Ik zou dus toch echt aanraden om er een 3com of intel kaartje in te proppen, weet je tenminste zeker dat je netwerk het goed doet.

Zo'n 3com/intel kaart kost wel iets meer, maar dat is 't (imho) echt wel waard, want zo als 't nu is blijf je er tijd in stoppen en misschien zelfs naar 't DC en terug, dus dat is zo terug verdient :-)

ErikKosters
14/08/06, 18:19
Aanstaande donderdag komt er een 3com/intel in.