hibernate性能优化:如何提高hibernate性能疯狂代码！

　　在

个拥有单独业务层

应用中

业务层必须在返回的前

为web层“准备”好其所需

数据集合

这就意味着业务层应该载入所有表现层/web层所需

数据

并将这些已例子化完毕

数据返回

通常

应用

应该为web层所需

每个集合

Hibernate.initialize

(这个

必须发生咱session关闭的前)；或者使用带有FETCH从句

或FetchMode.JOIN

Hibernate查询

事先取得所有

数据集合

如果你在应用中使用了Command模式

代替Session Facade

那么这项任务将会变得简单

多

　　你也可以通过merge

或lock

思路方法

在访问未例子化

集合(或代理)的前

为先前载入

对象绑定

个新

Session

显然

Hibernate将不会

也不应该自动完成这些任务

这将引入

个特殊

事务语义

　　有时候

你并不需要完全例子化整个大

集合

仅需要了解它

部分信息(例如其大小)、或者集合

部分内容

　　你可以使用集合过滤器得到其集合

大小

而不必例子化整个集合:

( (Integer) s.createFilter( collection, "select count(*)" ).list.get(0) ).Value

　　这里

createFilter

思路方法也可以被用来有效

抓取集合

部分内容

而无需例子化整个集合:

s.createFilter( lazyCollection, "").FirstResult(0).MaxResults(10).list;

　　20.1.5. 使用批量抓取(Using batch fetching)

　　Hibernate可以充分有效

使用批量抓取

也就是说

如果仅

个访问代理(或集合)

那么Hibernate将不载入其他未例子化

代理

批量抓取是延迟查询抓取

优化方案

你可以在两种批量抓取方案的间进行选择:在类级别和集合级别

　　类/实体级别

批量抓取很容易理解

假设你在运行时将需要面对下面

问题:你在

个Session中载入了25个 Cat例子

每个Cat例子都拥有

个引用成员owner

其指向Person

而Person类是代理

同时lazy="true"

如果你必须遍历整个cats集合

对每个元素

getOwner

思路方法

Hibernate将会默认

执行25次SELECT查询

得到其owner

代理对象

这时

你可以通过在映射文件

Person属性

显式声明batch-size

改变其行为:

< name="Person" batch-size="10">...</>

　　随的

Hibernate将只需要执行 3次查询

分别为10、10、 5

　　你也可以在集合级别定义批量抓取

例如

如果每个Person都拥有

个延迟载入

Cats集合

现在

Sesssion中载入了10个person对象

遍历person集合将会引起10次SELECT查询

每次查询都会

getCats

思路方法

如果你在Person

映射定义部分

允许对cats批量抓取, 那么

Hibernate将可以预先抓取整个集合

请看例子:

< name="Person"> < name="cats" batch-size="3"> ... </></>

　　如果整个

batch-size是3(笔误？)

那么Hibernate将会分 4次执行SELECT查询

按照3、3、3、1

大小分别载入数据

这里

每次载入

数据量还具体依赖于当前Session中未例子化集合

个数

　　如果你

模型中有嵌套

树状结构

例如典型

帐单－原料结构(bill-of-materials pattern)

集合

批量抓取是非常有用

(尽管在更多情况下对树进行读取时

嵌套集合(nested

)或原料路径(materialized path)(××) 是更好

解决思路方法

)

　　20.1.6. 使用子查询抓取(Using subselect fetching)

　　假若

个延迟集合或单值代理需要抓取

Hibernate会使用

个subselect重新运行原来

查询

次性读入所有

例子

这和批量抓取

实现思路方法是

样

不会有破碎

加载

　　20.1.7. 使用延迟属性抓取(Using lazy property fetching)

　　Hibernate3对单独

属性支持延迟抓取

这项优化技术也被称为组抓取(fetch groups)

请注意

该技术更多

属于市场特性

在实际应用中

优化行读取比优化列读取更重要

但是

仅载入类

部分属性在某些特定情况下会有用

例如在原有表中拥有几百列数据、数据模型无法改动

情况下

　　可以在映射文件中对特定

属性设置lazy

定义该属性为延迟载入

< name="Document"> <id name="id"> <generator ="native"/> </id> <property name="name" not-null="true" length="50"/> <property name="summary" not-null="true" length="200" lazy="true"/> <property name="text" not-null="true" length="2000" lazy="true"/></>

　　属性

延迟载入要求在其代码构建时加入 2进制指示指令(

code instrumentation)

如果你

持久类代码中未含有这些指令

Hibernate将会忽略这些属性

延迟设置

仍然将其直接载入

　　你可以在Ant

Task中

进行如下定义

对持久类代码加入“ 2进制指令

”

<target name="instrument" depends="compile"> <taskdef name="instrument" name="org.hibernate.tool.instrument.InstrumentTask"> <path path="${jar.path}"/> <path path="${es.dir}"/> <path refid="lib..path"/> </taskdef> <instrument verbose="true"> <file dir="${testes.dir}/org/hibernate/auction/model"> < name="*."/> </file> </instrument></target>

　　还有

种可以优化

思路方法

它使用HQL或条件查询

投影(projection)特性

可以避免读取非必要

列

这

点至少对只读事务是非常有用

它无需在代码构建时“ 2进制指令”处理

因此是

个更加值得选择

解决思路方法

　　有时你需要在HQL中通过抓取所有属性

强行抓取所有内容

　　20.2. 2级缓存Cache(The Second Level Cache)

　　Hibernate

Session在事务级别进行持久化数据

缓存Cache操作

当然

也有可能分别为每个类(或集合)

配置集群、或JVM级别(SessionFactory级别)

缓存Cache

你甚至可以为的插入

个集群

缓存Cache

注意

缓存Cache永远不知道其他应用

对持久化仓库(数据库)可能进行

修改 (即使可以将缓存Cache数据设定为定期失效)

　　默认情况下

Hibernate使用EHCache进行JVM级别

缓存Cache(目前

Hibernate已经废弃了对JCS

支持

未来版本中将会去掉它)

你可以通过设置hibernate.cache.provider_

属性

指定其他

缓存Cache策略

该缓存Cache策略必须实现org.hibernate.cache.CacheProvider接口

　　表 20.1. 缓存Cache策略提供商(Cache Providers) Cache Provider

Type Cluster Safe Query Cache Supported
Hashtable (not

ended for production use) org.hibernate.cache.HashtableCacheProvider memory 　 yes
EHCache org.hibernate.cache.EhCacheProvider memory, disk 　 yes
OSCache org.hibernate.cache.OSCacheProvider memory, disk 　 yes
SwarmCache org.hibernate.cache.SwarmCacheProvider clustered (ip multicast) yes (clustered invalidation) 　
JBoss TreeCache org.hibernate.cache.TreeCacheProvider clustered (ip multicast), transactional yes (replication) yes (clock sync req.)

　　20.2.1. 缓存Cache映射(Cache mappings)

　　类或者集合映射

“<cache>元素”可以有下列形式:

　　<cache usage="transactional|read-write|nonstrict-read-write|read-only" (1)/>

(1)

　　usage介绍说明了缓存Cache

策略: transactional、 read-write、 nonstrict-read-write或 read-only

　　另外(首选?), 你可以在hibernate.cfg.xml中指定<

-cache>和 <collection-cache> 元素

　　这里

usage 属性指明了缓存Cache并发策略(cache concurrency strategy)

　　20.2.2. 策略:只读缓存Cache(Strategy: read _disibledevent=>

　　20.2.3. 策略:读/写缓存Cache(Strategy: read/write)

　　如果应用

需要更新数据

那么使用读/写缓存Cache 比较合适

如果应用

要求“序列化事务”

隔离级别(serializable transaction isolation level)

那么就决不能使用这种缓存Cache策略

如果在JTA环境中使用缓存Cache

你必须指定hibernate.transaction.manager_lookup_

属性

值

通过它

Hibernate才能知道该应用

中JTA

TransactionManager

具体策略

在其它环境中

你必须保证在Session.close

、或Session.disconnect

前

整个事务已经结束

如果你想在集群环境中使用此策略

你必须保证底层

缓存Cache实现支持锁定(locking)

Hibernate内置

缓存Cache策略并不支持锁定功能

< name="eg.Cat" .... > <cache usage="read-write"/> .... < name="kittens" ... > <cache usage="read-write"/> .... </></>

　　20.2.4. 策略:非严格读/写缓存Cache(Strategy: nonstrict read/write)

　　如果应用

只偶尔需要更新数据(也就是说

两个事务同时更新同

记录

情况很不常见)

也不需要十分严格

事务隔离

那么比较适合使用非严格读/写缓存Cache策略

如果在JTA环境中使用该策略

你必须为其指定hibernate.transaction.manager_lookup_

属性

值

在其它环境中

你必须保证在Session.close

、或Session.disconnect

前

整个事务已经结束

　　20.2.5. 策略:事务缓存Cache(transactional)

　　Hibernate

事务缓存Cache策略提供了全事务

缓存Cache支持

例如对JBoss TreeCache

支持

这样

缓存Cache只能用于JTA环境中

你必须指定为其hibernate.transaction.manager_lookup_

属性

　　没有

种缓存Cache提供商能够支持上列

所有缓存Cache并发策略

下表中列出了各种提供器、及其各自适用

并发策略

　　表 20.2. 各种缓存Cache提供商对缓存Cache并发策略

支持情况(Cache Concurrency Strategy Support) Cache read-only nonstrict-read-write read-write transactional
Hashtable (not

ended for production use) yes yes yes 　
EHCache yes yes yes 　
OSCache yes yes yes 　
SwarmCache yes yes 　　
JBoss TreeCache yes 　　 yes

　　20.3. 管理缓存Cache(Managing the caches)

　　无论何时

当你给save

、update

或 saveOrUpdate

思路方法传递

个对象时

或使用load

、 get

、list

、iterate

或scroll

思路方法获得

个对象时, 该对象都将被加入到Session

内部缓存Cache中

　　当随后flush

思路方法被

时

对象

状态会和数据库取得同步

如果你不希望此同步操作发生

或者你正处理大量对象、需要对有效管理内存时

你可以

evict

思路方法

从

级缓存Cache中去掉这些对象及其集合

ScrollableResult cats = sess.createQuery("from Cat as cat").scroll; //a huge result while ( cats.next ) { Cat cat = (Cat) cats.get(0); doSomethingWithACat(cat); sess.evict(cat);}

　　Session还提供了

个contains

思路方法

用来判断某个例子是否处于当前session

缓存Cache中

　　如若要把所有

对象从session缓存Cache中彻底清除

则需要

Session.clear

　　对于 2级缓存Cache来说

在SessionFactory中定义了许多思路方法

清除缓存Cache中例子、整个类、集合例子或者整个集合

sessionFactory.evict(Cat., catId); //evict a particular CatsessionFactory.evict(Cat.); //evict all CatssessionFactory.evictCollection("Cat.kittens", catId); //evict a particular collection of kittenssessionFactory.evictCollection("Cat.kittens"); //evict all kitten collections

　　CacheMode参数用于控制具体

Session如何和 2级缓存Cache进行交互

　　CacheMode.NORMAL - 从 2级缓存Cache中读、写数据

　　CacheMode.GET - 从 2级缓存Cache中读取数据

仅在数据更新时对 2级缓存Cache写数据

　　CacheMode.PUT - 仅向 2级缓存Cache写数据

但不从 2级缓存Cache中读数据

　　CacheMode.REFRESH - 仅向 2级缓存Cache写数据

但不从 2级缓存Cache中读数据

通过 hibernate.cache.use_minimal_puts

设置

强制 2级缓存Cache从数据库中读取数据

刷新缓存Cache内容

　　如若需要查看 2级缓存Cache或查询缓存Cache区域

内容

你可以使用统计(Statistics) API

Map cacheEntries = sessionFactory.getStatistics .getSecondLevelCacheStatistics(regionName) .getEntries;

　　此时

你必须手工打开统计选项

可选

你可以让Hibernate更人工可读

方式维护缓存Cache内容

hibernate.generate_statistics truehibernate.cache.use_structured_entries true

　　20.4. 查询缓存Cache(The Query Cache)

　　查询

结果集也可以被缓存Cache

只有当经常使用同样

参数进行查询时

这才会有些用处

要使用查询缓存Cache

首先你必须打开它:

hibernate.cache.use_query_cache true

　　该设置将会创建两个缓存Cache区域 -

个用于保存查询结果集(org.hibernate.cache.StandardQueryCache)；另

个则用于保存最近查询

系列表

时间戳(org.hibernate.cache.UpdateTimestampsCache)

请注意:在查询缓存Cache中

它并不缓存Cache结果集中所包含

实体

确切状态；它只缓存Cache这些实体

标识符属性

值、以及各值类型

结果

所以查询缓存Cache通常会和 2级缓存Cache

起使用

　　绝大多数

查询并不能从查询缓存Cache中受益

所以Hibernate默认是不进行查询缓存Cache

如若需要进行缓存Cache

请

Query.

Cacheable(true)思路方法

这个

会让查询在执行过程中时先从缓存Cache中查找结果

并将自己

结果集放到缓存Cache中去

　　如果你要对查询缓存Cache

失效政策进行精确

控制

你必须

Query.

CacheRegion

思路方法

为每个查询指定其命名

缓存Cache区域

List blogs = sess.createQuery("from Blog blog where blog.blogger = :blogger") .Entity("blogger", blogger) .MaxResults(15) .Cacheable(true) .CacheRegion("frontpages") .list;

　　如果查询需要强行刷新其查询缓存Cache区域

那么你应该

Query.

CacheMode(CacheMode.REFRESH)思路方法

这对在其他进程中修改底层数据(例如

不通过Hibernate修改数据)

或对那些需要选择性更新特定查询结果集

情况特别有用

这是对SessionFactory.evictQueries

更为有效

替代方案

同样可以清除查询缓存Cache区域

　　20.5. 理解集合性能(Understanding Collection performance)

　　前面我们已经对集合进行了足够

讨论

本段中

我们将着重讲述集合在运行时

事宜

　　20.5.1. 分类(Taxonomy)

　　Hibernate定义了 3种基本类型

集合:

　　值数据集合

　　

对多关联

　　多对多关联

　　这个分类是区分了区别

表和外键关系类型

但是它没有告诉我们关系模型

所有内容

要完全理解他们

关系结构和性能特点

我们必须同时考虑“用于Hibernate更新或删除集合行数据

主键

结构”

因此得到了如下

分类:

　　有序集合类

　　集合(

s)

　　包(bags)

　　所有

有序集合类(maps, lists,

.gif' />s)都拥有

个由<key>和 <index>组成

主键

这种情况下集合类

更新是非常高效

——主键已经被有效

索引

因此当Hibernate试图更新或删除

行时

可以迅速找到该行数据

　　集合(

主键由<key>和其他元素字段构成

对于有些元素类型来说

这很低效

特别是组合元素或者大文本、大 2进制字段；数据库可能无法有效

对复杂

主键进行索引

另

方面

对于

对多、多对多关联

特别是合成

标识符来说

集合也可以达到同样

高效性能

( 附注:如果你希望SchemaExport为你

>创建主键

你必须把所有

字段都声明为not-null="true"

)

　　<idbag>映射定义了代理键

因此它总是可以很高效

被更新

事实上

<idbag>拥有着最好

性能表现

　　Bag是最差

bag允许重复

元素值

也没有索引字段

因此不可能定义主键

Hibernate无法判断出重复

行

当这种集合被更改时

Hibernate将会先完整地移除 (通过

个(in a single DELETE))整个集合

然后再重新创建整个集合

因此Bag是非常低效

　　请注意:对于

对多关联来说

“主键”很可能并不是数据库表

物理主键

但就算在此情况下

上面

分类仍然是有用

(它仍然反映了Hibernate在集合

各数据行中是如何进行“定位”

)

　　20.5.2. Lists, maps 和

s用于更新效率最高

　　根据我们上面

讨论

显然有序集合类型和大多数

都可以在增加、删除、修改元素中拥有最好

性能

　　可论证

是对于多对多关联、值数据集合而言

有序集合类比集合(

)有

个好处

Set

内在结构

如果“改变”了

个元素

Hibernate并不会更新(UPDATE)这

行

对于Set来说

只有在插入(INSERT)和删除(DELETE) 操作时“改变”才有效

再次强调:这段讨论对“

对多关联”并不适用

　　注意到

无法延迟载入

我们可以得出结论

list, map和idbags是最高效

(非反向)集合类型

则紧随其后

在Hibernate中

应该时最通用

集合类型

这时

“

”

语义在关系模型中是最自然

　　但是

在设计良好

Hibernate领域模型中

我们通常可以看到更多

集合事实上是带有inverse="true"

对多

关联

对于这些关联

更新操作将会在多对

这

端进行处理

因此对于此类情况

无需考虑其集合

更新性能

　　20.5.3. Bag和list是反向集合类中效率最高

　　在把bag扔进水沟的前

你必须了解

在

种情况下

bag

性能(包括list)要比

高得多: 对于指明了inverse="true"

集合类(比如说

标准

双向

对多关联)

我们可以在未

化(fetch)包元素

情况下直接向bag或list添加新元素！这是

Collection.add

)或者Collection.addAll

思路方法对bag或者List总是返回true(这点和和Set区别)

因此对于下面

相同代码来说

速度会快得多

Parent p = (Parent) sess.load(Parent., id); Child c =  Child; c.Parent(p); p.getChildren.add(c); //no need to fetch the collection! sess.flush;

　　20.5.4.

次性删除(One shot delete)

　　偶尔

逐个删除集合类中

元素是相当低效

Hibernate并没那么笨

如果你想要把整个集合都删除(比如说

list.clear

)

Hibernate只需要

个DELETE就搞定了

　　假设我们在

个长度为20

集合类中新增加了

个元素

然后再删除两个

Hibernate会安排

条INSERT语句和两条DELETE语句(除非集合类是

个bag)

这当然是显而易见

　　但是

假设我们删除了18个数据

只剩下2个

然后新增3个

则有两种处理方式:

　　逐

删除这18个数据

再新增 3个；

　　删除整个集合类(只用

句DELETE语句)

然后增加5个数据

　　Hibernate还没那么聪明

知道第 2种选择可能会比较快

(也许让Hibernate不这么聪明也是好事

否则可能会引发意外

“数据库触发器”的类

问题

)

　　幸运

是

你可以强制使用第 2种策略

你需要取消原来

整个集合类(解除其引用)

然后再返回

个新

例子化

集合类

只包含需要

元素

有些时候这是非常有用

　　显然

次性删除并不适用于被映射为inverse="true"

集合

　　20.6. 监测性能(Monitoring performance)

　　没有监测和性能参数而进行优化是毫无意义

Hibernate为其内部操作提供了

系列

示意图

因此可以从每个SessionFactory抓取其统计数据

　　20.6.1. 监测SessionFactory

　　你可以有两种方式访问SessionFactory

数据记录

第

种就是自己直接

sessionFactory.getStatistics

思路方法读取、显示统计数据

　　此外

如果你打开StatisticsService MBean选项

那么Hibernate则可以使用JMX技术发布其数据记录

你可以让应用中所有

SessionFactory同时共享

个MBean

也可以每个 SessionFactory分配

个MBean

下面

代码即是其演示代码:

// MBean service registration for a specic SessionFactoryHashtable tb =  Hashtable;tb.put("type", "statistics");tb.put("sessionFactory", "myFinancialApp");ObjectName _disibledevent=>
// MBean service registration for all SessionFactory'sHashtable tb =  Hashtable;tb.put("type", "statistics");tb.put("sessionFactory", "all");ObjectName _disibledevent=>

　　TODO:仍需要介绍说明是:在第个例子中我们直接得到和使用MBean；而在第 2个例子中在使用MBean的前 我们则需要给出SessionFactoryJNDI名使用hibernateStatsBean.SessionFactoryJNDIName("my/JNDI/Name") 得到SessionFactory然后将MBean保存于其中

　　你可以通过以下思路方法打开或关闭SessionFactory监测功能:

　　在配置期间将hibernate.generate_statistics设置为true或false；

　　在运行期间则可以可以通过sf.getStatistics.StatisticsEnabled(true) 或hibernateStatsBean.StatisticsEnabled(true)

　　你也可以在中clear思路方法重置统计数据logSummary 在日志中记录(info级别)其整理总结

　　20.6.2. 数据记录(Metrics)

　　Hibernate提供了系列数据记录其记录内容包括从最基本信息到和具体场景特殊信息所有测量值都可以由 Statistics接口进行访问主要分为 3类:

　　使用Session普通数据记录例如打开Session个数、取得JDBC连接数等；

　　实体、集合、查询、缓存Cache等内容统数据记录

　　和具体实体、集合、查询、缓存Cache相关详细数据记录

　　例如:你可以检查缓存Cache命中成功次数缓存Cache命中失败次数实体、集合和查询使用概率查询平均时间等请注意 Java中时间近似精度是毫秒Hibernate数据精度和具体JVM有关在有些平台上其精度甚至只能精确到10秒

　　你可以直接使用getter思路方法得到全局数据记录(例如和具体实体、集合、缓存Cache区无关数据)你也可以在具体查询中通过标记实体名、 或HQL、SQL语句得到某实体数据记录请参考Statistics、EntityStatistics、 CollectionStatistics、SecondLevelCacheStatistics、 和QueryStatisticsAPI文档以抓取更多信息下面代码则是个简单例子:

Statistics stats = HibernateUtil.sessionFactory.getStatistics;double queryCacheHitCount = stats.getQueryCacheHitCount;double queryCacheMissCount = stats.getQueryCacheMissCount;double queryCacheHitRatio = queryCacheHitCount / (queryCacheHitCount + queryCacheMissCount);log.info("Query Hit ratio:" + queryCacheHitRatio);EntityStatistics entityStats = stats.getEntityStatistics( Cat..getName );long changes = entityStats.getInsertCount + entityStats.getUpdateCount + entityStats.getDeleteCount;log.info(Cat..getName + " changed " + changes + "times" );

　　如果你想得到所有实体、集合、查询和缓存Cache区数据你可以通过以下思路方法获得实体、集合、查询和缓存Cache区列表: getQueries、getEntityNames、 getCollectionRoleNames和 getSecondLevelCacheRegionNames


	 
				                                                                                                                                                                                                                                      
			Tags: 	hibernate如何优化 如何使用hibernate hibernate性能 hibernate性能优化 
						
			延伸阅读
			 
			
					2009-9-2-- hibernate性能优化:Hibernate程序性能优化
				
					2009-9-2-- hibernate性能优化:优化Hibernate性能的几点建议
				
					2009-1-15-- hibernate性能:性能、规模、风险 初评hibernate
				
					2009-9-2-- hibernate使用:使用hibernate的11大优势
				
					2009-8-17-- hibernate性能优化:Hibernate的性能优化
				
					2009-9-2-- hibernate优化:Hibernate优化思路方法解析
				
					2009-8-17-- hibernate性能优化:优化Hibernate性能的几点建议

hibernate性能优化:如何提高hibernate性能

延伸阅读

最新评论

发表评论

赞助商广告

随机更新

热门标注

最近更新

最新标注