The &quot;g&quot; _should_ do it. Quite puzzling.<br>Can you do a run and find an example of when it fails? Is it always 0xbd?<br><br>Maybe someone in Tibet doesn&#39;t like your code :-)  (It&#39;s a Tibetan character code in utf8)<br>
<br><div class="gmail_quote">On Thu, Mar 31, 2011 at 2:59 PM, Geoffrey Myers <span dir="ltr">&lt;<a href="mailto:lists@serioustechnology.com">lists@serioustechnology.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">
<div class="im">Jim Kinney wrote:<br>
&gt; should it be replaced with nothing or with a NULL? Does the perl pointer<br>
&gt; jump to the next character automatically when a match is made thus<br>
&gt; skipping a character in your replace? Does a double run fix it?<br>
<br>
</div>Missed the first question.  It should be removed, not replaced with an<br>
null.  For example I have:<br>
<br>
This is my &lt;UGLY CHARACTER&gt;data<br>
<br>
Should then be:<br>
<br>
This is my data<br>
<div class="im"><br>
&gt;<br>
&gt; On Thu, Mar 31, 2011 at 12:04 PM, Geoffrey Myers<br>
</div><div class="im">&gt; &lt;<a href="mailto:lists@serioustechnology.com">lists@serioustechnology.com</a> &lt;mailto:<a href="mailto:lists@serioustechnology.com">lists@serioustechnology.com</a>&gt;&gt; wrote:<br>
&gt;<br>
&gt;     So, we are trying to convert a number of postgresql databases that were<br>
&gt;     created with SQL_ASCII encoding to UTF8 encoding.  As such, I need to<br>
&gt;     strip certain characters out of the data before dumping and reloading<br>
&gt;     the new databases.  I&#39;m using the following:<br>
&gt;<br>
&gt;     data =~ s/(.)/((ord($1) &gt;= 0) &amp;&amp; (ord($1) &lt;= 8))<br>
&gt;                     || (ord($1) == 11)<br>
&gt;                     || ((ord($1) &gt;= 13) &amp;&amp; (ord($1) &lt;= 31))<br>
&gt;                     || ((ord($1) &gt;= 127)) ?&quot;&quot;: $1/egs;<br>
&gt;<br>
&gt;     Yet I&#39;m getting the following error, which indicates a character that<br>
&gt;     should be handled by the above code is still in the data:<br>
&gt;<br>
&gt;     pg_restore: [archiver (db)] COPY failed: ERROR:  invalid byte sequence<br>
&gt;     for encoding &quot;UTF8&quot;: 0xbd<br>
&gt;<br>
&gt;<br>
&gt;     Certainly, the above code should replace the 0xbd with nothing?<br>
&gt;<br>
&gt;     Any perl/postgres gurus out there?<br>
&gt;<br>
&gt;     --<br>
&gt;     Until later, Geoffrey<br>
&gt;<br>
&gt;     &quot;I predict future happiness for America if they can prevent<br>
&gt;     the government from wasting the labors of the people under<br>
&gt;     the pretense of taking care of them.&quot;<br>
&gt;     - Thomas Jefferson<br>
&gt;     _______________________________________________<br>
&gt;     Ale mailing list<br>
</div>&gt;     <a href="mailto:Ale@ale.org">Ale@ale.org</a> &lt;mailto:<a href="mailto:Ale@ale.org">Ale@ale.org</a>&gt;<br>
<div class="im">&gt;     <a href="http://mail.ale.org/mailman/listinfo/ale" target="_blank">http://mail.ale.org/mailman/listinfo/ale</a><br>
&gt;     See JOBS, ANNOUNCE and SCHOOLS lists at<br>
&gt;     <a href="http://mail.ale.org/mailman/listinfo" target="_blank">http://mail.ale.org/mailman/listinfo</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; --<br>
&gt; James P. Kinney III<br>
&gt; I would rather stumble along in freedom than walk effortlessly in chains.<br>
&gt;<br>
&gt;<br>
&gt;<br>
</div>&gt; ------------------------------------------------------------------------<br>
<div><div></div><div class="h5">&gt;<br>
&gt; _______________________________________________<br>
&gt; Ale mailing list<br>
&gt; <a href="mailto:Ale@ale.org">Ale@ale.org</a><br>
&gt; <a href="http://mail.ale.org/mailman/listinfo/ale" target="_blank">http://mail.ale.org/mailman/listinfo/ale</a><br>
&gt; See JOBS, ANNOUNCE and SCHOOLS lists at<br>
&gt; <a href="http://mail.ale.org/mailman/listinfo" target="_blank">http://mail.ale.org/mailman/listinfo</a><br>
<br>
<br>
--<br>
Until later, Geoffrey<br>
<br>
&quot;I predict future happiness for America if they can prevent<br>
the government from wasting the labors of the people under<br>
the pretense of taking care of them.&quot;<br>
- Thomas Jefferson<br>
_______________________________________________<br>
Ale mailing list<br>
<a href="mailto:Ale@ale.org">Ale@ale.org</a><br>
<a href="http://mail.ale.org/mailman/listinfo/ale" target="_blank">http://mail.ale.org/mailman/listinfo/ale</a><br>
See JOBS, ANNOUNCE and SCHOOLS lists at<br>
<a href="http://mail.ale.org/mailman/listinfo" target="_blank">http://mail.ale.org/mailman/listinfo</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>-- <br>James P. Kinney III<br>I would rather stumble along in freedom than walk effortlessly in chains.<br><br><br>