<div dir="ltr">Glad you're back in business!</div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Oct 20, 2015 at 12:25 PM, Jim Kinney <span dir="ltr"><<a href="mailto:jkinney@jimkinney.us" target="_blank">jkinney@jimkinney.us</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>Yep. The 10G card driver had oopsed all over itself and wouldn't keep a connection up. I initially tried to stop network, unload the module, load the module, start the network but even that failed to reset the card completely. I needed to add a sleep 20 before loading the module again. Once the connection was actually working the system was cleanly rebooted to lop off the zombies and things were happily OK.</div><span class=""><div><br></div><div>On Tue, 2015-10-20 at 11:32 -0400, Ed Cashin wrote:</div></span><blockquote type="cite"><div><div class="h5"><div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Mon, Oct 19, 2015 at 10:58 PM, Jim Kinney <span dir="ltr"><<a href="mailto:jim.kinney@gmail.com" target="_blank">jim.kinney@gmail.com</a>></span> wrote:<br><div>... </div><blockquote type="cite"><p dir="ltr">Other system with same nfs mounted storage is fine. Storage server is connected to both number crunchers by dedicated, unswitched 10Gbps fiber ethernet. <br>
> </p><br></blockquote></div><br>You mean with direct connections?  In that case, the other number cruncher's connection could be fine, while the affected system could not be able to do networking to the NFS server (for some as yet undetermined reason), which could result in the behavior you describe if the NFS mount is "hard".<br clear="all"><div><br></div>-- <br><div><div dir="ltr">  Ed Cashin <<a href="mailto:ecashin@noserose.net" target="_blank">ecashin@noserose.net</a>></div></div>
</div></div>
</div></div><pre>_______________________________________________
Ale mailing list
<span class=""><a href="mailto:Ale@ale.org" target="_blank">Ale@ale.org</a>
<a href="http://mail.ale.org/mailman/listinfo/ale" target="_blank">http://mail.ale.org/mailman/listinfo/ale</a>
See JOBS, ANNOUNCE and SCHOOLS lists at
<a href="http://mail.ale.org/mailman/listinfo" target="_blank">http://mail.ale.org/mailman/listinfo</a>
</span></pre></blockquote></div><br>_______________________________________________<br>
Ale mailing list<br>
<a href="mailto:Ale@ale.org">Ale@ale.org</a><br>
<a href="http://mail.ale.org/mailman/listinfo/ale" rel="noreferrer" target="_blank">http://mail.ale.org/mailman/listinfo/ale</a><br>
See JOBS, ANNOUNCE and SCHOOLS lists at<br>
<a href="http://mail.ale.org/mailman/listinfo" rel="noreferrer" target="_blank">http://mail.ale.org/mailman/listinfo</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><div dir="ltr">  Ed Cashin <<a href="mailto:ecashin@noserose.net" target="_blank">ecashin@noserose.net</a>></div></div>
</div>