|
private void btnGo_Click(object sender, EventArgs e)
{
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false); //应用当前语言包。
WebClient wc = new WebClient();
byte[] oimg = wc.DownloadData(txtImageUrl.Text); // 自己修改成要识别的地址吧
Bitmap bp = new Bitmap(new MemoryStream(oimg), true);//识别图像
Bitmap bp2 = new Bitmap(new MemoryStream(oimg), true);
picBox1.Image = bp2;
picBox2.Image = bp;
List<tessnet2.Word> result = new List<tessnet2.Word>();
string txt = "";
try
{
result = ocr.DoOCR(bp, Rectangle.Empty);//执行识别操作
foreach (tessnet2.Word word in result)//遍历识别结果。
{
txt += word.Text;
}
}
catch (Exception ex)
{
}
wc.close();
bp.dispose();
bp2.dispose();
wc.close();
ocr.dispose();
GC.Collect();
GC.WaitForPendingFinalizers();
GC.Collect();
textBox1.Text = txt;
}
从云脉OCR SDK开发者平台上下接入了一个API,测试时发现,这段代码每次都消耗内存, 重复多次使用后,把内存消耗完了。
最主要是下面几步:
tessnet2.Tesseract ocr = new tessnet2.Tesseract();//声明一个OCR类
string defaultCharList="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ-";
if (!string.IsNullOrEmpty(txtCharList.Text))
{
defaultCharList = txtCharList.Text;
}
ocr.SetVariable("tessedit_char_whitelist", defaultCharList);//设置识别变量,当前只能识别数字及英文字符。
ocr.Init(Application.StartupPath + @"\tessdata", "eng", false);
特别耗内存。
大家有没有好的解决办法
|
|