<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
  </head>
  <body>
    <p>Dear Mika,</p>
    <div class="moz-cite-prefix">On 3/23/22 1:27 PM, Mika Silander
      wrote:<br>
    </div>
    <blockquote type="cite"
      cite="mid:324254453.4868098.1648038475789.JavaMail.zimbra@csc.fi">
      <pre class="moz-quote-pre" wrap=""> Calling out to the list again before trying to reinvent a wheel. We have a collector that tries to connect to the source of security events, but the source service is (temporarily) inaccessible. IntelMQ restarts the bot, an error message and the connection failure exception gets output to the log, and after a while, the bot gets restarted. For us it is acceptable there's a few failures in a configurable time frame, but if the situation prevails, we'd like to be alerted and if possible, prevent the bot from restarting.

 There are bot configuration parameters to stop a bot in case the processing of events fails repeatedly (error_procedure=stop, error_max_retries=suitable_number as in <a class="moz-txt-link-freetext" href="https://intelmq.readthedocs.io/en/maintenance/user/configuration-management.html#id14">https://intelmq.readthedocs.io/en/maintenance/user/configuration-management.html#id14</a>), but after some experimenting it appears they are not applicable here since we never reach the stage of processing events.</pre>
    </blockquote>
    <p>If the fetch fails, an exception in thrown in process(). That
      enters the error handling in start() as described in the
      documentation. But collectors are a bit different to parsers,
      experts and outputs, as they don't have an incoming message as
      trigger, but operation on their own, e.g. rate limiting.</p>
    <p>Reading the code, I think your bot should stop, as <span
        class="pl-s1"><span class="pl-token active"
data-hydro-click="{"event_type":"code_navigation.click_on_symbol","payload":{"action":"click_on_symbol","repository_id":21160389,"ref":"develop","language":"Python","backend":"ALEPH_PRECISE","code_nav_context":"BLOB_VIEW","retry_backend":"","originating_url":"https://github.com/certtools/intelmq/find-definition?q=error_on_message&blob_path=intelmq%2Flib%2Fbot.py&ref=develop&language=Python&row=384&col=19&code_nav_context=BLOB_VIEW","user_id":199050}}"
data-hydro-click-hmac="95d07e985dab48f1e1bf176e2b9bae4e756b31a1071cb4ea5b719bb1322deb5c">error_on_message
          is active in this case, which increases the error counter.
          When the counter is hit, it should stop if error_procedure ==
          "stop".<br>
        </span></span></p>
    <blockquote type="cite"
      cite="mid:324254453.4868098.1648038475789.JavaMail.zimbra@csc.fi">
      <pre class="moz-quote-pre" wrap=""> Any ideas how to address this issue? We'd prefer not to touch the bot's source code.</pre>
    </blockquote>
    <p>IntelMQ by itself does not notify you of any failures. I have
      used the logcheck rules to monitor IntelMQ's logs:
      <a class="moz-txt-link-freetext" href="https://github.com/certtools/intelmq/tree/develop/contrib/logcheck">https://github.com/certtools/intelmq/tree/develop/contrib/logcheck</a>
      While that's not a perfect solution, it is super easy. For
      anything more advanced, an integration into a monitoring would be
      feasible.</p>
    <p>kind regards<br>
      Sebastian<br>
    </p>
  </body>
</html>