Mybatis动态sql语句foreach中拼接正则表达式字符串注意事项

今天要说到的查询情况，平时项目里边其实用到的并不是很多，使用正则表达式无非是为了匹配结果比较灵活，最常见的，我们的查询条件一般一个参数仅仅只是一种情况的筛选，对于如何选择查询方式，主要还是要看前端传递的查询条件格式，比如单参数只表示单个值，而且数据表对应也是单个值，这种最简单，精确匹配的话，就直接where 字段=参数值，如果模糊查询，就使用like匹配，如果前端传递的某个参数，值是用逗号分割的一个字符串，实际上可以看做是多个匹配条件，而数据表中，对应的字段值是单个值的话，可以where find_in_set(字段,字符串参数值)或者将分割的字符串转换成List，然后用in匹配

还有一种就是前端传递的参数值是逗号分割的字符串，对应要查询匹配的字段，数据表中存的也是以逗号分割的字符串，查询的时候，一般是或关系，就需要从表中查询出只要包含查询条件中的其中一个值的匹配结果

举例来说吧，比如昨天一个需求是需要根据标签id来查询只要含有这些标签中其中给一个标签的企业。

先看swagger文档:

这是一个get请求方式的分页查询，重点就是下边那个tagIdList参数，前端传递的是一个逗号分割的id字符串，是两个标签，而企业也是多标签的，现在从企业中查询出有这两个标签的企业(其实就是或的关系）

接下来看mybatis xml中的sql写法吧

    <select id="pageList" resultType="com.xiaomifeng1010.response.vo.EtpSrvcListedCltvtnVO">
        select
        cltvtn.id,
        SUBSTRING_INDEX(cltvtn.state_record,',',-1) as state,
        cltvtn.name,
        (select name from sys_dict where code = cltvtn.nature) as nature,
        (select name from sys_dict where code = cltvtn.register_region) as register_region,
        (select name from sys_dict where code = cltvtn.industry) as industry,
        cltvtn.uscc,
        cltvtn.master_data_id,
        cltvtn.wr_tech_type_mid_small_etp,
        cltvtn.wr_high_new_tech_industry,
        group_concat(distinct tag.tag_name) as tag_names
        from
        etp_srvc_listed_cltvtn cltvtn
        join enterprise_info info
        on cltvtn.uscc=info.uscc
        left join enterprise_tag_mid mid on info.id=mid.enterprise_id
        left join enterprise_tag tag on mid.tag_id=tag.id
        where cltvtn.del_flag = 0

        <if test="param.name != null and param.name != ''">
            and cltvtn.name like concat('%',#{param.name},'%')
        </if>
        <if test="param.uscc != null and param.uscc != ''">
            and cltvtn.uscc like concat('%',#{param.uscc},'%')
        </if>
        <if test="param.nature != null">
            and cltvtn.nature = #{param.nature}
        </if>
        <if test="param.registerRegion != null and param.registerRegion != ''">
            and cltvtn.register_region = #{param.registerRegion}
        </if>
        <if test="param.state!=null">
            and SUBSTRING_INDEX(cltvtn.state_record,',',-1)=#{param.state,jdbcType=INTEGER}
        </if>
        group by cltvtn.name,cltvtn.uscc
        <if test="param.tagIdList != null and param.tagIdList.size() != 0">
            HAVING group_concat(distinct tag.id) REGEXP
            replace(<foreach collection="param.tagIdList" item="tagId" separator="|" open="concat("
                             close=")">
            #{tagId,jdbcType=BIGINT}
        </foreach>,' ','')
        </if>
        <if test="param.sort != '' and param.sort != null">
            order by ${param.sort}
        </if>
        <if test="param.sort == '' or param.sort == null">
            order by cltvtn.create_time desc
        </if>


    </select>

要匹配标签或关系：

我一开始是这样写的，为什么这样写的，因为以前我使用Integer类型的枚举值List时候这样用是可以正常匹配的，所以Id值是Long类型的依然这样用，但是结果查询结果出乎我的预料，当我选择单个标签或者不选标签的时候，是可以正常查询结果的，但是当我选择的是两个标签时候，奇怪的事情就发生了，居然一条结果都没有了！像下边这样：

我选单个标签的时候，是可以查询出231条结果的

但是当我选择两个标签的时候，居然一条结果都没有：

正常情况下，foreach拼接的tagId，拼接好，完整的sql应该是这样的：

我在navicat中直接执行这个语句是可以正常查询到结果的，但是在程序中就是没有查询结果，所以我又去试了一下测试环境，并查看日志，并且我把#{tagId}换成了${tagId}方便直接打印sql的时候直接带上参数，而不是占位符，看到的日志信息就是这样的：

可以看到使用concat拼接的正则表达式每个id以及‘|’符号之间都加上了空格，应该是mybatis加上的，所以为了去掉空格，所以我又加上了replace函数，然后在本地测试，结果本地可以查询出来一些结果了，但是结果却是只有匹配第二个标签的结果，好家伙，replace没有替换掉‘|’符号前边那个id的空格？然后发到测试环境，结果测试环境，还是查不到结果，就非常诡异，正常情况下replace是可以替换掉字符串中所有空格的，在Navicat中运行也是正常的：

既然mybatis会改变最终的拼接结果，那么索性不用mybatis来拼接了，解决方案是使用ognl表达式，直接用java的api就可以了，所以最终改写成了：

<select id="pageList" resultType="com.xiaomifeng1010.response.vo.EtpSrvcListedCltvtnVO">
        select
        cltvtn.id,
        SUBSTRING_INDEX(cltvtn.state_record,',',-1) as state,
        cltvtn.name,
        (select name from sys_dict where code = cltvtn.nature) as nature,
        (select name from sys_dict where code = cltvtn.register_region) as register_region,
        (select name from sys_dict where code = cltvtn.industry) as industry,
        cltvtn.uscc,
        cltvtn.master_data_id,
        cltvtn.wr_tech_type_mid_small_etp,
        cltvtn.wr_high_new_tech_industry,
        group_concat(distinct tag.tag_name) as tag_names
        from
        etp_srvc_listed_cltvtn cltvtn
        join enterprise_info info
        on cltvtn.uscc=info.uscc
        left join enterprise_tag_mid mid on info.id=mid.enterprise_id
        left join enterprise_tag tag on mid.tag_id=tag.id
        where cltvtn.del_flag = 0

        <if test="param.name != null and param.name != ''">
            and cltvtn.name like concat('%',#{param.name},'%')
        </if>
        <if test="param.uscc != null and param.uscc != ''">
            and cltvtn.uscc like concat('%',#{param.uscc},'%')
        </if>
        <if test="param.nature != null">
            and cltvtn.nature = #{param.nature}
        </if>
        <if test="param.registerRegion != null and param.registerRegion != ''">
            and cltvtn.register_region = #{param.registerRegion}
        </if>
        <if test="param.state!=null">
            and SUBSTRING_INDEX(cltvtn.state_record,',',-1)=#{param.state,jdbcType=INTEGER}
        </if>
        group by cltvtn.name,cltvtn.uscc
        <if test="param.tagIdList != null and param.tagIdList.size() != 0">
            <bind name="joiner" value="@com.google.common.base.Joiner@on('|')"/>
            <bind name="tagIds" value="joiner.join(param.tagIdList)"/>
            HAVING group_concat(distinct tag.id) REGEXP
            #{tagIds}
        </if>
        <if test="param.sort != '' and param.sort != null">
            order by ${param.sort}
        </if>
        <if test="param.sort == '' or param.sort == null">
            order by cltvtn.create_time desc
        </if>


    </select>

然后再到swagger文档中测试,就可以正常查询到准确的结果条数了：

但是如果是Integer类型的枚举值列表，使用foreach来拼接正则表达式，目前测试是可以正常查询的，比如另外一个查询场景：之前的一个业务，在新增金融政策的时候，政策类型下拉选只能单选，所以设计的数据表字段直接是枚举int类型，1,2,3来存储的，后来要求这个字段可以下拉多选，所以就改成了字符串类型，多选的时候，传递过来的参数值就类似‘1,2,3’这样逗号拼接的字符串存储到该字段中，同时查询也由单选改成了多选：

所以查询也要改写成这样：

<select id="pageList" resultType="com.xiaomifeng1010.response.vo.FinancePolicyVO">
        select
        fp.id,
        fp.title,
        fp.publish_date,
        fp.content,
        fp.publish_office,
        fp.written_date,
        fp.type
        from finance_policy fp
        where fp.del_flag = 0
        <if test="param.title != '' and param.title != null">
            and fp.title like concat('%',#{param.title},'%')
        </if>
        <if test="param.supportType != '' and param.supportType != null">
            and fp.support_type like concat('%',#{param.supportType},'%')
        </if>

        <if test="param.supportMode != '' and param.supportMode != null">
            and fp.support_mode like concat('%',#{param.supportMode},'%')
        </if>
        <if test="@org.apache.commons.lang3.StringUtils@isNotBlank(param.type)">
            and fp.type like concat('%',#{param.type},'%')

        </if>
        <if test="@org.apache.commons.collections4.CollectionUtils@isNotEmpty(param.typeList)">
            and fp.type REGEXP
            <foreach collection="param.typeList" open="concat(" item="type" close=")" separator="|">
                #{type,jdbcType=INTEGER}
            </foreach>

        </if>
        <if test="param.dateRange != null">
            and fp.publish_date >= subdate(CURRENT_DATE,#{param.dateRange})
        </if>
        <if test="param.sort != '' and param.sort != null">
            order by ${param.sort}
        </if>
        <if test="param.sort == '' or param.sort == null">
            order by fp.publish_date desc
        </if>
    </select>

注意这里拼接的是integer类型的值：