Different
大约 5 分钟
Different
目录
字符类型
字符
C语言
:单引号声明字符、双引号声明字符串Python
:单引号或双引号声明字符串,没有字符类型
转义字符
转义字符与字面量(多语言)
字符名称 | C/C++ | Java | HTML | 英语 | ASCII符号 | 十进制ASCII码 | 十六进制ASCII码 |
---|---|---|---|---|---|---|---|
换行符 | \n | \n | line feed | NL(LF) | 10 | 0x0A | |
水平制表符 | \t | \t | table | HT | 9 | 0x09 | |
垂直制表符 | \v | vertical | VY | 11 | 0x0B | ||
退格 | \b | \b | backspace | BS | 8 | 0x08 | |
回车 | \r | carriage return | CR | 13 | 0x0D | ||
振铃 | \a | alert | BEL | 7 | 0x07 | ||
反斜杠 | \\ | \ | 92 | 0x5C | |||
单引号 | \' | \' | ' | 39 | 0x27 | ||
双引号 | \" | \" | " | quotes | " | 34 | 0x22 |
问号 | \? | \? | ? | 63 | 0x3F | ||
换页符 | \f | ||||||
空字符 | \0 | ||||||
空格 | 毋需 | \s | | space | |||
与号 | 毋需 | 毋需 | & | & | |||
小于号 | 毋需 | 毋需 | < | less | < | ||
大于号 | 毋需 | 毋需 | > | greater than | > | ||
八进制ASCII | \0dd | \ddd | |||||
16进制ASCII | \0xaa | ||||||
16进制Unicdoe | \uxxxx | \uxxxx |
补充:
- 现代系统并非都支持所有的转义序列。例如输入振铃字符时,有些系统保持沉默
- 通用字符名:
\u
后8个十六进制位,\U
后16个十六进制位,表示的是ISO 10646
码点
字符串拼接
C语言
:需要引入库<string.h>
,再用函数strcat(str1,str2)
Python、Java
:使用字面量表达方式+
底层实现
C/C++、Qt
:不自带,分别使用string.h、string、QString
库,底层由数组实现- 元素是可变的(本质就是修改数组元素)
Java
:使用String
库元素是不可变的(本质上是指针,但Java不能直接通过指针操作地址)
Java这样做的原因:
Java字符串由char值序列组成,而他的char数据类型是一个采用UTF-16编码表示Unicode码点的代码单元。
length
方法将返回采用UTF-16编码表示的给定字符串所需要的代码单元数量
s.charAt(n)
方法返回序列为n的代码单元
如果能够修改序列成员,其代码单元的长度是不可控的(大多数的常用Unicode字符是一个代码单元,有一些会超出)
Python
:Python自带- 元素是不可变的(不是指针,可以通过
==
直接比较字符串大小) - Python这样做的原因:
- (1) 字符串能更好地作为字典的主键
- (2) 好像是对于变量的底层存储模型不同???????
- 元素是不可变的(不是指针,可以通过
原理互通
C字符数组 vs JavaString
在C程序员第一次接触Java字符串的时候,常常会感到迷惑,因为他们总将字符串认为是字符型数组
char greeting[] = "Hello";
这种认识是错误的,Java字符串大致类似于char*指针
char* greeting = "Hello";
替换字符时的原理
char* temp = malloc(6);
strncpy(temp, greeting, 3);
strncpy(temp+3, "p!", 3);
greeting = temp;
是否会内存泄露:不会,Java会自动进行垃圾回收。如果一块内存不再使用了,系统最终会将其回收。
greeting = "Howdy";
C++ String对象 vs JavaString
- 也自动地进行内存的分配与回收。内存管理是通过构造器、赋值操作和析构器显式执行的。
- 然而,C++字符串是可修改的,也就是说,可以修改字符串中的单个字符。
比较
C
- 不能用~~
==
~~,比较的是地址。本质上都是指针。strcmp()
- 不能用~~
C++ String类
- C++的string类重载了
==
运算符以便检测字符串内容的相等性 - 可惜Java没有采用这种方式,它的字符串 “看起来、感觉起来” 与数值一样,但进行相等性测试时,其操作方式又类似于指针 语言的设计者本应该像对+那样也进行特殊处理,即重定义==运算符。
- C++的string类重载了
Java
不能用~~
==
~~,比较的是地址。本质上都是指针。s.equals(t)
但和C/C++不同的是,Java中的字符串是共享的
如果虚拟机始终将相同的字符串共享,就可以使用==运算符检测是否相等。
但实际上只有字符串常量是共享的,而+或substring等操作产生的结果并不是共享的。
String greeting = "Hello"; if(greeting == "Hello"); // probably true if(greeting.substring(0,3) == "Hel"); // probably false
Python
==
:使用来比较两个字符串内的value值是否相同is
:比较两个字符串的id值
特殊字符串(格式、原始、模板字符串)
语言 | 格式字符串
| |||
---|---|---|---|---|
c/c++ | 格式字符串
| 原始字符串
| 模板字符串
| 字符串拼接(这个有点怪)
|
python | 格式字符串
| 原始字符串
| 模板字符串
| 字符串拼接
|
js | 格式字符串
| 原始字符串
| 模板字符串
| 字符串拼接
|
java | 格式字符串
| 原始字符串
| 模板字符串
| 字符串拼接
|
链接到当前文件 0
没有文件链接到当前文件