PostgreSQL去掉表中所有不可见字符的操作

 更新时间:2020年12月29日 15:17:01   作者:asin929  
这篇文章主要介绍了PostgreSQL去掉表中所有不可见字符的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

问题描述

数据库中的某些数据中包含了某些不可见字符。ASCII码中的0-31,127属于控制字符,不可见。

这些不可见字符往往是不需要的,我们要想办法删除它。

解决办法

写一函数,将所有字段中的不可见字符替换为空格。

测试流程

环境准备

建表,并插入带不可见字符的记录。注:下列数据中的不可见字符在粘贴过来的时候自动去掉了,请按ALT+数字键加入。

CREATE TABLE public.test_table
(

 xm character varying(50),
 pinyin character varying(200),
 sm character(15)
)
WITH (
 OIDS=FALSE
);
ALTER TABLE public.test_table
 OWNER TO postgres;


-- ----------------------------
-- Records of test_table
-- ----------------------------
INSERT INTO ry_syrk_copy VALUES ('周小星xx', 'xx测试','测试' );
INSERT INTO ry_syrk_copy VALUES ('李华', '测试xx','世xx界' );

注:因不可见字符无法在CSDN中无法打出,故用xx代替。实际上在其它地方可以用ALT+数字键打印出来。

去掉表中所有的不可见字符

-- 函数说明:将表test_table中所有的不可见字符替换掉
CREATE OR REPLACE FUNCTION delete_special_char() RETURNS int8 AS $$
DECLARE
 row RECORD;  
BEGIN

-- 查询表中所有类型为字符串的列
FOR row in select column_name from information_schema.columns where table_name = 'test_table' and data_type like 'character%' LOOP 
 FOR i IN 1..31 LOOP --替换所有的不可见字符为空格(除了chr(0)之外)
  EXECUTE 'update test_table set ' || row.column_name || ' = replace(' || row.column_name || ', chr(' || i || '), '' '' )';
 END LOOP;   
END LOOP;

RETURN 1;

END;

$$ LANGUAGE plpgsql;

执行函数

执行函数–select * from delete_special_char(),之后查看表数据,所有的不可见字符都被替换为空格。

补充–如何删除chr(0)

值得注意的是上述函数并不能删除chr(0)的不可见字符,见如下测试。

但oracle中上述语句却可以成功执行,下面我就来讲一讲吧~

Oracle中varchar2字段的不可见字符处理

在以前的项目中,曾经出现加密后的字符串数据丢失,加密内容无法正常解密的情况,经查找原因,发现是数据库表的varchar2字段中有chr(0)的不可见字符(即我们通常所说的\0),当出现这种情况时,由于java和c++中对字符串处理的不同,将会导致所取得的字符串长度不同。

在java中,字符串的长度可以通过取字符串的字节数组来获得,这样得到的字符串长度为字符串实际的大小(汉字2个字节,其他1个字节);在c++中通过strlen函数获得的字符串长度为第一个字节\0之前的字符长度。

当我们在编写jni的时候,经常会遇到将java的字符串转换为c++中的字符串的情况,这样,当java中的字符串包含\0的空字节时,在对c++转换后的字符串求取长度时,不要使用strlen函数,否则,其仅仅对\0字节之前的内容求取长度,与实际大小不同。

解决该类问题,根据所属应用的不同,可通过三种手段解决:

在数据库层解决:

Oracle数据库中,可在查询语句中使用函数replace来去除字符串中的非可见字符,例如:

select replace(content,chr(0),null) from bossquery_request where sky_command = '02';

以后大家如果遇到类似情况,可通过replace(字段名,chr(ASCII码值),null)来去掉其中对应的ASCII码值的字符。

在java程序中解决:

在java程序中,大家可通过获取String对象的所有字节内容,对字节内容进行扫描,来去掉其中不需要的字节。

在JNI层解决:

在JNI层解决该问题的方式是,不要使用strlen函数来获取字符串长度,可通过GetArrayLength取字节数组长度函数或者其他类似函数来获取字符串长度,则可避免该情况发生。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • Docker安装PostgreSQL数据库的详细步骤

    Docker安装PostgreSQL数据库的详细步骤

    这篇文章主要介绍了Docker安装PostgreSQL数据库的详细步骤,包括启动PostgreSQL容器、获取容器的IP地址、启动一个新的CentOS容器、在CentOS容器中安装PostgreSQL客户端、通过psql客户端连接到PostgreSQL容器和在PostgreSQL中执行SQL操作等内容,需要的朋友可以参考下
    2024-10-10
  • 浅析postgresql 数据库 TimescaleDB 修改分区时间范围

    浅析postgresql 数据库 TimescaleDB 修改分区时间范围

    这篇文章主要介绍了浅析postgresql 数据库 TimescaleDB 修改分区时间范围,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-01-01
  • navicat无法连接postgreSQL-11的解决方案

    navicat无法连接postgreSQL-11的解决方案

    这篇文章主要介绍了navicat无法连接postgreSQL-11的解决方案,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • pgsql 如何手动触发归档

    pgsql 如何手动触发归档

    这篇文章主要介绍了pgsql手动触发归档的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • PostgreSQL如何查询表结构和索引信息

    PostgreSQL如何查询表结构和索引信息

    文章介绍了在PostgreSQL中查询表结构和索引信息的几种方法,包括使用`\d`元命令、系统数据字典查询以及使用可视化工具DBeaver
    2024-12-12
  • PostgreSQL时间相差天数代码实例

    PostgreSQL时间相差天数代码实例

    PostgreSQL是一款简介而又性能强大的数据库应用程序,其在日期时间数据方面所支持的功能也都非常给力,这篇文章主要给大家介绍了关于PostgreSQL时间相差天数的相关资料,需要的朋友可以参考下
    2023-11-11
  • pgsql 实现分页查询方式

    pgsql 实现分页查询方式

    这篇文章主要介绍了pgsql 实现分页查询方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • 关于PostgreSql数据库与mysql数据库的不同点以及注意事项

    关于PostgreSql数据库与mysql数据库的不同点以及注意事项

    PostgreSQL和MySQL是两种流行的关系型数据库管理系统(RDBMS),它们都可以用来存储和管理数据,但是它们在某些方面有所不同,下面这篇文章主要给大家介绍了关于PostgreSql数据库与mysql数据库的不同点以及注意事项的相关资料,需要的朋友可以参考下
    2023-05-05
  • postgresql实现对已有数据表分区处理的操作详解

    postgresql实现对已有数据表分区处理的操作详解

    这篇文章主要为大家详细介绍了postgresql实现对已有数据表分区处理的操作的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2023-12-12
  • postgresql 中round函数的用法说明

    postgresql 中round函数的用法说明

    这篇文章主要介绍了postgresql 中round函数的用法说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01

最新评论