varchar类型字段为什么经常定义成255

MySQL | ver < 4.1： VARCHAR以字节为单位存储，所以假设全部为常用汉字（UTF-8

3字节编码长度），则VARCHAR(255)共可存放约85个汉字；

MySQL | ver >= 4.1：

VARCHAR以字符为单位存储，假设输入仍然为常用汉字，则VARCHAR(255)可以存放255个汉字。

另外，据我所知，MySQL对UTF-8的支持也仅仅限于1~3字节编码长度（Unicode：0x0000~0xFFFF），可以满足大部分需求，但是生僻字就不行了。

那么VARCHAR的最大值是多少呢？

根据官方文档，VARCHAR 最多可以是 65535 字节（这也意味着一条记录只有这一个字段，因为 MySQL 一行只能包含 65535 字节）。

然而，无法为这么长的 VARCHAR 做索引，对于 MyISAM，可以对前 1000 个字节做索引，对于 InnoDB，则只有 767 字节。（来源依据）

在varchar长度接近256时，varchar长度设置成255的好处：

1、方便InnoDB建索引，对于 MyISAM，可以对前 1000 个字节做索引，对于 InnoDB，则只有 767 字节。（来源依据）。255X3=765

2、少申请一个字节，记录字符创长度，一个8位的tinyint，可以表示的无符号数值的范围是，0-255，如果长度超过了255，需要在申请个字节

1.MySQL建立索引时假设没有限制索引的大小，索引长度会默认採用的该字段的长度。也就是说varchar(20)和varchar(255)相应的索引长度分别为20*3(utf-8)(+2+1),255*3(utf-8)(+2+1)。当中"+2"用来存储长度信息，“+1”用来标记是否为空。载入索引信息时用varchar(255)类型会占用很多其它的内存；（备注：当字段定义为非空的时候。是否为空的标记将不占用字节）

比如。測试sql(InnoDB引擎)例如以下:

CREATE DATABASE TestDataBase

USE TestDataBase

CREATE TABLE ABC (

  `id` int(11) DEFAULT NULL,

  `name` varchar(20) DEFAULT NULL

) ENGINE=InnoDB DEFAULT CHARSET=utf8

ALTER  TABLE  `ABC`  ADD  INDEX `nameIndex` (`name`)

explain select name from ABC

alter table ABC  modify name varchar(255)

explain select name from ABC

结果中的ken_len表示索引使用的字节数:

key_len的长度计算公式：

varchr(10)变长字段且同意NULL:10*(Character Set：utf8=3,gbk=2,latin1=1)+1(NULL)+2(变长字段)

varchr(10)变长字段且不同意NULL:10*(Character Set：utf8=3,gbk=2,latin1=1)+2(变长字段)

char(10)固定字段且同意NULL:10*(Character Set：utf8=3,gbk=2,latin1=1)+1(NULL)

char(10)固定字段且同意NULL:10*(Character Set：utf8=3,gbk=2,latin1=1)

依据这个值。就能够推断索引使用情况，特别是在组合索引的时候，推断全部的索引字段都被查询用到。

2.varchar(20)与varchar(255)都是保持可变的字符串，当使用ROW_FORMAT=FIXED创建MyISAM表时，会为每行使用固定的长度空间，这样设置不同的varchar长度值时。存储相同数据所占用的空间是不一样。

通常情况下使用varchar(20)和varchar(255)保持'hello'占用的空间都是一样的，但使用长度较短的列却有巨大的优势。较大的列使用很多其它的内存。由于MySQL一般会分配固定大小的内存块来保存值，这对排序或使用基于内存的暂时表尤其不好。相同的事情也会发生在使用文件排序或者基于磁盘的暂时表的时候。

很多时候我们看到一些表字符串类型的字段定义为varchar(255)，开始以为varchar只能定义为255这个长度值，其实不然。

官方文档所说，varchar有效的最大长度取决于行的容量，以及用的字符集，整行的所有列的定义长度不能超过65535字节(bytes)，text、blob等大字段类型除外，

P.S. https://dev.mysql.com/doc/refman/5.7/en/char.html

《小白学习MySQL - 变通创建索引的案例一则》提到了，

InnoDB，如果需要建索引，就不能超过767bytes，utf8编码，255*3=765 bytes，是能建索引情况下的最大值，utf8mb4编码，默认字符长度则应该是767除以4向下取整，就是191。如果设置了innodb_large_prefix，最大长度是3072字节，utf8编码，1024*3=3072 bytes，utf8mb4编码，768*4=3072。

MyISAM，如果需要建索引，就不能超过1000bytes，utf8编码，333*3=999 bytes，是能建索引情况下的最大值，utf8mb4编码，默认字符长度则应该是1000除以4，就是250。

一般情况下，我们用的是InnoDB引擎，utf8则是常用字符集，因此varchar类型字段定义为255比较合适。

但实际上，varchar(255)并不是最优的字符定义长度，究竟定成多少，还是要根据实际需求来决定，例如这个字段我就不需要创建索引，定义超过255，是可以的，只能说255是常规情况下较少出错的一个值。

有没有觉得我们设置varchar长度的时候，很多时候都设置成255，这是为什么呢？

其实是因为在5.5.3版本之前

InnoDB存储引擎的表索引的前缀长度最长是767字节(bytes)，

MyIsam存储引擎的表索引的前缀长度最长是1000字节(bytes)。

所以如果字段要创建索引的话，长度就不能超过对应存储引擎的要求 767 bytes或 1000 bytes，而如果中文按1个字符占用3个字节计算，总字节数刚好为765。

1071 - Specified key was too long; max key length is 767 bytes

要控制字节长度，就要说到字节编码了。

一、位(bit)、字节(byte)、字符

位(bit)：计算机内部数据储存的最小单位，10001000是一个八位二进制数。

字节(byte)：计算机中数据处理的基本单位，习惯上用大写 B 来表示。