Hibernate下數(shù)據(jù)大局部處理
發(fā)表時(shí)間:2024-01-11 來(lái)源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]很多人都對(duì)Java在批量數(shù)據(jù)的處理方面是否是其合適的場(chǎng)所持有懷疑的念頭,由此延伸,那么就會(huì)認(rèn)為ORM可能也不是特別適合數(shù)據(jù)的批量處理。 其實(shí),我想如果我們應(yīng)用得當(dāng)?shù)脑?huà),完全可以消除ORM批量處理性能問(wèn)題這方面的顧慮。下面以Hibernate為例來(lái)做為說(shuō)明,假如我們真的不得不在Java中使用Hibe...
很多人都對(duì)Java在批量數(shù)據(jù)的處理方面是否是其合適的場(chǎng)所持有懷疑的念頭,由此延伸,那么就會(huì)認(rèn)為ORM可能也不是特別適合數(shù)據(jù)的批量處理。 其實(shí),我想如果我們應(yīng)用得當(dāng)?shù)脑?huà),完全可以消除ORM批量處理性能問(wèn)題這方面的顧慮。下面以Hibernate為例來(lái)做為說(shuō)明,假如我們真的不得不在Java中使用Hibernate來(lái)對(duì)數(shù)據(jù)進(jìn)行批量處理的話(huà)。 向數(shù)據(jù)庫(kù)插入100 000條數(shù)據(jù),用Hibernate可能像這樣:
Session session = sessionFactory.openSession();
Transaction tx = session.beginTransaction();
for ( int i=0; i<100000; i++ ) {
Customer customer = new Customer(.....);
session.save(customer); }
tx.commit();
session.close();
大概在運(yùn)行到第50 000條的時(shí)候,就會(huì)出現(xiàn)內(nèi)存溢出而失敗。這是Hibernate把最近插入的Customer都以session-level cache在內(nèi)存做緩存,我們不要忘記Hiberante并沒(méi)有限制first-level cache 的緩存大。
# 持久對(duì)象實(shí)例被管理在事務(wù)結(jié)束時(shí),此時(shí)Hibernate與數(shù)據(jù)庫(kù)同步任何已經(jīng)發(fā)生變 化的被管理的的對(duì)象。
# Session實(shí)現(xiàn)了異步write-behind,它允許Hibernate顯式地寫(xiě)操作的批處理。 這里,我給出Hibernate如何實(shí)現(xiàn)批量插入的方法:
首先,我們?cè)O(shè)置一個(gè)合理的JDBC批處理大小,hibernate.jdbc.batch_size 20。 然后在一定間隔對(duì)Session進(jìn)行flush()和clear()。
Session session = sessionFactory.openSession();
Transaction tx = session.beginTransaction();
for ( int i=0; i<100000; i++ ) {
Customer customer = new Customer(.....);
session.save(customer);
if ( i % 20 == 0 ) {
//flush 插入數(shù)據(jù)和釋放內(nèi)存:
session.flush(); session.clear(); }
}
tx.commit();
session.close();
那么,關(guān)于怎樣刪除和更新數(shù)據(jù)呢?那好,在Hibernate2.1.6或者更后版本,scroll() 這個(gè)方法將是最好的途徑:
Session session = sessionFactory.openSession();
Transaction tx = session.beginTransaction();
ScrollableResults customers = session.getNamedQuery("GetCustomers")
.scroll(ScrollMode.FORWARD_ONLY);
int count=0;
while ( customers.next() ) {
Customer customer = (Customer) customers.get(0);
customer.updateStuff(...);
if ( ++count % 20 == 0 ) {
//flush 更新數(shù)據(jù)和釋放內(nèi)存:
session.flush(); session.clear(); } }
tx.commit(); session.close();
這種做法并不困難,也不算不優(yōu)雅。請(qǐng)注意,如果Customer啟用了second-level caching ,我們?nèi)匀粫?huì)有一些內(nèi)存管理的問(wèn)題。原因就是對(duì)于用戶(hù)的每一次插入和更新,Hibernate在事務(wù)處理結(jié)束后不得不通告second-level cache 。因此,我們?cè)谂幚砬闆r下將要禁用用戶(hù)使用緩存。