1.进入百度云控制台,找到文字识别服务,创建一个应用
2.引入ocr需要的maven依赖包
<dependency>
<groupId>com.baidu.aip</groupId>
<artifactId>java-sdk</artifactId>
<version>4.16.11</version>
</dependency>
3.直接上代码编写一个简单的测试方法
import java.util.*;
import org.json.JSONException;
import org.json.JSONObject;
import com.baidu.aip.ocr.AipOcr;
/**
* 图片文字提取
*/
public class TextExtraction {
//设置APPID/AK/SK
public static final String APP_ID = "xxx";
public static final String API_KEY = "xxxxxx";
public static final String SECRET_KEY = "xxxxx";
public static void main(String[] args) throws JSONException {
// 初始化一个AipOcr
AipOcr client = new AipOcr(APP_ID, API_KEY, SECRET_KEY);
// 可选:设置网络连接参数
client.setConnectionTimeoutInMillis(2000);
client.setSocketTimeoutInMillis(60000);
// 调用接口
String path = "D:/test/test.jpg";
JSONObject res = client.basicGeneral(path, new HashMap<String, String>());
System.out.println(res.toString(2));
}
}
注:APP_ID,API_KEY,SECRET_KEY换成自己的。
4.运行测试方法,我测试的图片如下:
5.运行结果如下
图片的每一行字放在一个对象里面