<div dir="ltr"><br><div>I have set up 2 VM guests ( currently on the same hardware ) which is configured as such:</div><div><br></div><div>Host 1:  172.27.0.11</div><div>  Bind 9 : Master</div><div>  dhcpd : Primary</div><div>  Postfix relay </div><div><br></div><div>Host 2: 172.27.0.12</div><div><div>  Bind 9 : Master</div><div>  dhcpd : Failover</div></div><div>  Postfix relay</div><div><br></div><div>Heartbeat Failover IP : 172.27.0.10</div><div><br></div><div>  I have all the components and and working happily.  I want bind 9 resolving on both hosts for the sake of load but dhcpd only responding on 1 IP and postfix is to only answer/send on the .10.  Failover tests have done what I want, the way I want.</div><div><br></div><div>  The problem I&#39;m running into is dhcpd will work great for 3-5 days and then all of a sudden start throwing errors: </div><div><div>Mar 30 15:50:01 basvc01 dhcpd: DHCPDISCOVER from c8:9c:dc:da:b4:bf via <a href="http://172.27.4.1">172.27.4.1</a>: not responding (recovering)</div><div>Mar 30 15:50:01 basvc01 dhcpd: DHCPDISCOVER from 00:50:56:a0:57:aa via <a href="http://172.27.6.1">172.27.6.1</a>: not responding (recovering)</div><div>Mar 30 15:50:05 basvc01 dhcpd: DHCPDISCOVER from c8:9c:dc:da:b4:bf via <a href="http://172.27.4.1">172.27.4.1</a>: not responding (recovering)</div></div><div><br></div><div>If I disable the failover function and only run on host1, dhcpd runs great and without error.  </div><div><br></div><div>Here is the failover definition included in the main dhcpd.conf:</div><div><div>failover peer &quot;failover-partner&quot; {</div><div>    primary;</div><div>    # on Primary</div><div>    address 172.27.0.11;</div><div>    # on Secondary</div><div>    #address 172.27.0.12;</div><div>    port 519;</div><div>    # on Primary</div><div>    peer address 172.27.0.12;</div><div>    # on Secondary</div><div>    #peer address 172.27.0.11;</div><div>    peer port 520;</div><div>    max-response-delay 120;</div><div>    max-unacked-updates 30;</div><div>    mclt 7200;</div><div>    split 128;</div><div>    load balance max seconds 5;</div><div>}</div></div><div><br></div><div>Here is the head of one of my dhcpd config files ( including multiple for multiple vlans in dhcpd.conf ).  Note I commented out the failover lines so it&#39;ll work for now:</div><div><br></div><div><div># SCM - VLAN 806</div><div># <a href="http://172.27.6.0/24">172.27.6.0/24</a> subnet</div><div>subnet 172.27.6.0 netmask 255.255.255.0 {</div><div>        pool {</div><div>#               failover peer &quot;failover-partner&quot;;</div><div>                range   172.27.6.200 172.27.6.250;</div><div>        }</div><div>        option routers                          172.27.6.1;</div><div>        option subnet-mask                      255.255.255.0;</div><div>        option broadcast-address                172.27.6.255;</div><div>        option time-offset                      -25200; # MDT</div><div>        option ntp-servers                      <a href="http://time.nist.gov">time.nist.gov</a>, <a href="http://time-a.timefreq.bldrdoc.gov">time-a.timefreq.bldrdoc.gov</a>;</div><div>        use-host-decl-names                     on;</div><div>        one-lease-per-client                    on;</div><div>        default-lease-time                      21600;</div><div>        max-lease-time                          43200;</div><div>        option domain-name-servers              172.27.0.10;</div><div>        option domain-name                      &quot;<a href="http://scm.baengr.company.com">scm.baengr.company.com</a>&quot;;</div><div>        option domain-search                    &quot;<a href="http://scm.baengr.company.com">scm.baengr.company.com</a>&quot;, &quot;company.local&quot;;</div><div>        zone scm.baengr. {</div><div>                primary 172.27.0.11;</div><div>                secondary 172.27.0.12;</div><div>        }</div><div><br></div><div>        zone 6.27.172.in-addr.arpa. {</div><div>                primary 172.27.0.11;</div><div>                secondary 172.27.0.12;</div><div>        }</div><div>}</div><div># Static Assignments</div></div><div><br></div><div><br></div><div>Any thoughts?  Everything I can find on google says it&#39;s a port timing or firewall issue. These are 2 Linux VM&#39;s on the same Host, no firewall between them, no iptables either currently.</div><div><br></div><div>Robert</div><div><br></div><div><br></div></div>